태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다 ^^

 

오늘은 'Include: 낮은 세부 수준에서 계산하기' 에 대해서 배워볼까 합니다~!

 

이 예에서는 표준 영업 데이터베이스(Tableau에서 제공되는 Superstore 데이터베이스)를 살펴보겠습니다.

여기서 각 행은 특정 항목의 매출을 나타냅니다.

Order(주문)에는 여러 항목이 포함될 수 있으며 주문은 여러 행에 나누어져 입력될 수 있습니다.

즉, 이 데이터베이스의 가장 깊은 수준의 세부 수준은 고유한 항목입니다.

 

데이터베이스 스냅샷의 첫 번째 행은 Bush Somerset Bookcase(부시 서머셋 책장) 2개에 대한 구매입니다.

두 번째 행은 Hon Stacking Chairs(혼 스태킹 의자) 3개에 대한 구매입니다.

이 두개의 행이 단일 주문인 주문 CA-2013-152156을 구성합니다.

지역별 영업 실적을 분석하고 있는 경우 평균 주문 규모가 가장 큰(또는 작은) 지역을 파악하려면 어떻게 해야할까요?

 

이 정보를 파악하려면 주문별 규모를 계산(각 Order ID에 해당하는 매출 합계를 산출)한 다음 해당 값에 대한

지역별 평균을 산출해야 합니다.

이 비즈니스 질문은 충분히 물어볼 가능성이 있는 질문이며 새로운 LOD 표현식 구문을 사용하면 Tableau에서

이에 대한 답변을 쉽게 구할 수 있습니다.

 

다음은 새로운 구문에 대한 좀 세부적인 설명입니다.

 

{INCLUDE [Order ID] : SUM([Sales])}

LOD 표현식은 여기서 볼 수 있는 것처럼 계산 에디터에서 작성할 수 있습니다. 이 LOD 표현식은 각 Order ID별 구매

합계를 구하기 위해 사용되었습니다. 그 결과는 Order Size(주문 규모)라는 새로운 필드입니다.

 

왼쪽의 막대는 LOD 표현식으로 계산된 Region(지역)별 평균 주문 규모를 보여주는 반면 ,

오른쪽의 막대는 Region(지역)별 평균 Sales(매출)을 보여줍니다.

예를 들어 주문관 상관없이 모든 주문라인 항목의 평균). 이제 다음 질문에 대한 답변을 구할 수 있습니다.

평균 주문 규모가 가장 큰 Region(지역)은 어디입니까?

 

북부 아시아와 중부 아시아가 각각 $737 및 $733로 평균 Order Size(주문 규모)가 가장 크다는 것을 볼 수 있습니다.

비쥬얼라이제이션에 Order ID(주문 ID)가 표시되지 않음에도 불구하고 이 정보를 파악할 수 있습니다.

(Tableau버전9 이전에는 뷰에 Order ID(주문 ID)를 추가하지 않고 해당 값을 계산할 수 없었습니다.)

그림의 오른쪽 막대에서 볼 수 있듯이 Region(지역) 및 AVG(Sales)를 표시했다면 원하는 결과가 아닌 Region(지역)별

모든 라인 항목의 평균이 표시되었을 것입니다.

반면에 Order Size(주문 규모)에 대한 LOD 표현식의 경우 주문별 규모를 먼저 구한 다음 (즉, 주문 내 모든 라인 항목의

매출합계) 해당 주문 결과에 대한 Region(지역)별 평균을 구해 Region(지역)별 Order Size(주문규모)를 구할 수 있습니다.

 

이제 평균 주문 규모가 가장 큰 지역을 파악했으니 조금 더 복잡한 질문을 해보겠습니다.

 

영업 데이터베이스에 있는 국가 중 평균적으로 '규모가 가장 큰 거래'를 성사시키는 영업 담당자들이 속한 국가가

어느 곳입니까? 수행하려는 작업은 다음과 같습니다.

1. 영업 담당자별 성사시킨 가장 규모가 큰 거래(최대값 거래)를 찾은 다음

2. 해당 '최대 규모 거래'에 대한 국가별 평균을 구합니다.

이 질문에는 여러 측면이 있지만 LOD 표현식을 사용하면 답변을 쉽게 구할 수 있습니다.

 

AVG({INCLUDE [Sales Rep] : MAX([Sales])})

Avg Largest Sales Deal by Rep(담당자별 평균 최대 규모 영업 거래)라는 LOD 표현식이 영업 담당자별 평균 최대값

거래를 계산하기 위해 사용되었습니다. 이 경우 LOD 표현식의 평균이 계산 에디터 창에 직접 입력됩니다.

 

 

이 질문에 대한 답변은 복잡한 수식 없이 하나의 표현식인 AVG({INCLUDE [Sales Rep] : MAX([Sales])})로 구할 수

있었습니다. 실제로 뷰에 차원을 추가하여 데이터에 대한 추가 질문을 할 수도 있으며 이 경우 계산이 업데이트됩니다.

예를 들어, 분석에 Year(연도)를 추가해 보겠습니다.

 

 

계산에서 INCLUDE 키워드를 사용하면 Sales Rep(영업 담당자) 필드가 계산에 명시적으로 포함되지만

비쥬얼라이제이션에 배치된 모든 다른 차원도 포함됩니다. (이 경우 Country(국가) 및 Year(연도)).

뷰에 Year(연도)를 추가하면 분석을 더욱 깊이 있게 수행하여 다음과 같은 정보를 얻을 수 있습니다.

2012년에는 바레인의 평균 '최대 규모 거래'가 $4,069로 가장 높았습니다.

 

다음 흐름 도표는 Tableau에서 INCLUDE LOD 표현식이 수행되는 방법을 시각적으로 설명합니다.

 

INCLUDE 키워드는 비쥬얼라이제이션 LOD에 비해 집계 수준이 낮은 (즉, 더 세부적인) 표현식을 만듭니다.

지정된 차원은 계산이 수행되기 전에 비쥬얼라이제이션 LOD에 먼저 추가됩니다.

INCLUDE 표현식은 뷰에서 집계된 측정값으로 사용되었습니다.

실제로 모든 INCLUDE 표현식은 뷰에 배치될 때 측정값 또는 집계된 측정값으로 사용됩니다.

 

다음 시간에는 Exclude 를 배워보도록 하겠습니다.

오늘도 수고하셨습니다 ^^ 다음에 또 만나요~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요 , 디포커스 태블로 둥이입니다.

오늘은 세부 수준(LOD) 표현식을 설명해 드리려고 합니다.

 

Tableau에서는 데이터 분석을 통해 즐거운 경험을 하게 만드는 것을 목표로 삼고 있습니다.

문제를 해결하기 위해 도구를 사용하는 방법에 대해 고민해야 한다면 흐름이 깨집니다.

질문하는 것은 간단하지만, 답변을 구하는 과정에는 어려움이 따릅니다.

 

예는 다음과 같습니다.

* 분기별로 회사의 주문이 100개 이상이었던 일 수를 파악할 수 있습니까?

* 영업 담당자별로 성사된 거래 중 규모가 가장 큰 거래를 찾고 관리자별 평균을 파악할 수 있습니까?

* 각 고객에게 처음 고객이 된 연도를 태그로 지정한 다음, 해당 태그를 사용하여 매출을 그룹화할 수 있습니까?

 

Tableau 에서는 이러한 질문에 대한 답변을 찾을 수 있도록 세부 수준(LOD) 표현식이라는 새로운 구문을 도입했습니다.

 

LOD 표현식의 작동 방법 ㅡ '세부 수준' 설명

데이터 탐색의 핵심은 원본의 구조를 이해하는 데 있습니다.

예를 들어 가장 세부적인 수준이 주소별로 나열된 레스토랑 검사 데이터가 있다고 가정해 보겠습니다.

데이터를 집계하여 우편 번호, 구/군/시, 시/도 또는 국가별로 속성을 확인해 보려고 합니다.

 

Tableau에서는 원하는 차원(예: 구/군/시, 시/도)을 뷰에 드롭하여 이러한 작업을 수행할 수 있습니다.

뷰에 추가한 차원에 따라 데이터가 '비쥬얼라이제이션 세부 수준' 즉, 비쥬얼라이제이션 LOD로 집계됩니다.

 

(비쥬얼라이제이션 LOD를 변경함)

하이라이트된 선반에 차원을 배치하면 비쥬얼라이제이션 LOD에 추가됩니다.

 

(비쥬얼라이제이션 LOD를 변경하지 않음)

차원을 페이지, 필터 및 도구 설명 선반에 배치하면 비쥬얼라이제이션 LOD에 추가되지 않습니다.

시각적으로 표시하지 않으면서 뷰에 있는 데이터를 수정할 수 있습니다.

 

요점을 말씀 드리겠습니다~!

 

LOD 표현식을 사용하면 세부 수준(예: 차원)을 비쥬얼라이제이션에 실제로 드롭하지 않고도

계산에서 사용되는 세부 수준을 결정할 수 있습니다.

 

레스토랑 검사 데이터를 사용하는 다음 대시보드의 경우, 뷰에 두 개의 차원이 추가되었습니다.

 

뷰에 더욱 세부적인 차원을 추가하면 비쥬얼라이제이션 LOD의 집계 수준이 낮아집니다.

예를 들어,

Business ID를 세부 정보 선반에 드롭하여 비쥬얼라이제이션에 추가하면 비즈니스별 평균 사용자층을 볼 수 있습니다.

이렇게 하면 비쥬얼라이제이션도 변경됩니다. 개별 비즈니스가 맵에서 원으로 표시됩니다.

 

하지만 ..... 비쥬얼라이제이션을 변경하지 않으려면 어떻게 해야 할까요?

비즈니스 ID별 총 고객층을 결정하고 구/군/시별 해당 값의 평균을 구하고 구/군/시별로 원을 하나씩만 표시하려면

어떻게 해야 할까요?

 

구/군/시별 각 레스토랑의 평균 고객 수를 파악하려고 합니다. 이렇게 하려면 비쥬얼라이제이션에 차원을 드래그하지

않고 뷰에 차원을 추가해야 합니다. LOD 표현식을 사용하면 이 작업을 수행할 수 있습니다.

 

Fans per Business(비즈니스별 고객 수)라는 새 계산된 필드를 만들어 보겠습니다.

 

{FIXED [Business ID] : SUM([User Fans])}

 

이 표현식을 사용하면 비쥬얼라이제이션에 사용된 다른 차원과 관계없이 Tableau에서 각 Business ID에 대한 집계를

수행합니다. LOD 표현식을 사용하여 Business ID별 총 User Fans(사용자 수)를 계산할 수 있습니다.

이 새 필드를 뷰에 드래그한 다음 구/군/시별 해당 값에 대한 평균을 구할 수 있습니다.

 

LOD 표현식에 FIXED 연산자를 사용하면 Business ID(비즈니스 ID)별로 평균 사용자가 더 많은 구/군/시에 대한 정보를

얻을 수 있습니다. 즉, 파란색이 더 진한 구/군/시는 인기 있는 레스토랑이 더 많다(또는 해당 구/군/시의 인구가 더 많고

이에 따라 레스토랑별 사용자가 더 많음)는 것을 의미합니다.

 

LOD 표현식 키워드에는 EXCLUDE, INCLUDE, FIXED 등 3가지 유형이 있으며

각 키워드로 LOD 표현식의 범위를 다르게 지정할 수 있습니다.

 

그럼 다음 시간에는 INCLUDE  에 대해서 배워보겠습니다~!

감사합니다. *^^*

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~ 디포커스 태블로 둥이입니다~! ^^

 

오늘 알아볼 차트는 영역 차트입니다.

라인 차트랑 비슷하게 시계열 추이를 보는 차트이지만, 일반적인 추이보다는 영역을 색깔로

채우는 개념이기 때문에 측정값을 누적해서 보는 경우에 주로 사용하게 됩니다.

연도별 매출 누적값을 대분류 별로 표현해 보았습니다.

 

연도별 그래프를 분기별로 더 자세하게 매출값이 누적되었는지 알아볼까요?

연속형 날짜, 분기별로 나타내어 매출의 누적값을 영역 그래프로 나타낼 수 있습니다.

 

그럼 다음 이 시간에 새로운 차트로 또 만나요~~~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

+ Recent posts