태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요 , 디포커스 태블로 둥이입니다.

오늘은 'Fixed: 정확한 세부 수준 지정하기'에 대하여 설명 드리겠습니다.

LOD 표현식을 사용하면 비쥬얼라이제이션 LOD와 완전하게 독립적으로 집계 수준을 만들 수 있습니다.

이전에는 맞춤 SQL을 통해서만 이러한 작업을 수행할 수 있었습니다.

YELP 데이터를 분석하여 비즈니스의 첫 리뷰가 작성된 연도별 집단을 찾으려 한다고 가정해 보겠습니다.

각 집단의 리뷰 트렌드가 동일합니까?

LOD 표현식을 사용하면 정확한 세부 수준에서 집단을 지정할 수 있습니다.

 

{FIXED [Business - Id] : MIN(YEAR([Review Date]))}

LOD 표현식은 Business ID별로 세부 수준을 고정합니다.

그런 다음 Business ID별 모든 리뷰에서 Review Date(리뷰 날짜)의 최소 Year(연도)를 찾고

해당 값을 Business ID와 연결합니다. First Review Year(첫 리뷰 연도)를 데이터베이스의 새 열로 간주할 수 있습니다.

 

비주얼라이제이션에서 이 필드를 사용할 때 계산 범위가 표현식에 암시적으로 정의됩니다.

아래에 표시된 것과 같이 각 Business ID(비즈니스 ID)First Review Year(첫 리뷰 연도)가 기록되면

집단을 탐색하여 정보를 얻을 수 있습니다.

 

 

 

 

FIXED 키워드를 사용하면 계산의 집계 수준을 구체적으로 정의할 수 있습니다.

INCLUDE EXCLUDE와 달리 비주얼라이제이션에서 사용되는 차원과 독립적으로 수행됩니다.

FIXED 표현식의 결과는 FIXED 차원과 비주얼라이제이션 LOD의 관계에 따라 비주얼라이제이션 LOD보다

광범위하거나 세부적일 수 있습니다.

 

 

First Review Year(첫 리뷰 연도)를 필터로 사용해 보겠습니다.

 

각 연도별 집단에는 차원형구간차원이 지정되었습니다.

, First Review Year (첫 리뷰 연도)가 뷰에서 차원으로 사용되습니다.

FIXED 표현식은 차원 또는 측정값으로 사용할 수 있습니다.

Tableau는 데이터 유형에 따라 계산 결과를 차원 또는 측정값으로 지정합니다.

INCLUDE/EXCLUDE FIXED의 주요 차이점은 아래 표시된 것과 같이 필터링 계층 상의 각 위치입니다.

FIXED LOD 표현식은 차원 필터 전 및 컨텍스트 필터 후에 계산됩니다. 여러 사용 사례에서 이를 활용할 수 있습니다.

 

다음 시간에는 사례에 대해서 배워보도록 하겠습니다.

다음에 뵙겠습니다~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

 

안녕하세요, 디포커스 태블로 둥이입니다~!

'Exclude: 더 높은 세부 수준에서 계산하기' 에 대해서 배워보도록 하겠습니다.

 

다음 시나리오를 가정해 보십시오.

월별 총 Sales(매출) 및 Region(지역)별 총 매출을 확인하려고 합니다. 그러면 다음을 수행해야 합니다.

1. 월별 Total Sales(총 매출) 계산에서 Region(지역)을 제외해야 합니다.

2. 그런 다음 지역별 Sales(매출) 세부 정보를 계산할 때 Region(지역)을 포함해야 합니다.

 

앞서 설명한 영업 데이터베이스를 사용하여 또 다른 예제를 살펴보겠습니다.

 

 

{EXCLUDE [Region] : SUM([Sales])}

Total Sales(총 매출)라는 이 LOD 표현식을 사용하면 모든 지역의 월별 총 매출을 계산할 수 있습니다.

 

위 비주얼라이제이션에서는 Region(지역)이 열 선반에 배치되어 Region(지역), Month()(Order Date(주문일))

비주얼라이제이션 LOD에 영향을 미칩니다.

EXCLUDE 표현식을 사용하면 총 매출을 계산(모든 지역)하면서 지역별 매출 세부 정보를 표시할 수 있습니다.

이에 따라 다음과 같이 비주얼라이제이션 LOD에 비해 상위수준에 있는(, 덜 세부적인) LOD 표현식을 만들었습니다.

 

EXCLUDE 키워드의 핵심은 다음과 같습니다.

Tableau에서는 먼저 비주얼라이제이션 LOD에서 제외된 차원을 삭제하고 해당 차원이 없는 것으로 간주하고

계산을 수행합니다. 그런 다음 그 결과가 시각적으로 표시됩니다.

 

다음 흐름 도표는 Tableau에서 EXCLUDE LOD 표현식이 수행되는 방법에 대한 시각적인 설명입니다.

 

{EXCLUDE [Region] : SUM([Sales])}이라는 표현식을 사용하면 TableauRegion(지역)차원을 제외하고

비주얼라이제이션에서 사용된 모든 차원을 사용하여 매출 합계를 계산합니다.

따라서 모든 지역의 총 매출을 나타내는 월별 단일 값이 산출됩니다.

 

이제 SUM 집계를 사용하는 Total Sales(총 매출) Region(지역)Sales(매출)모두 보여주는 강력한 뷰가 있습니다.

집계를 조합할 수도 있습니다.

예를 들어, LOD 표현식을 변경하여 지역별 합계를 표시하면서 월별 평균 Sales(매출)을 표시하도록 해보겠습니다.

 

 

INCLUDE 표현식과 유사하게 모든 EXCLUDE 표현식은 뷰에 배치될 때 측정값 또는 집계된 측정값으로 사용됩니다.

이러한 유형의 표현식은 '구성 비율' 또는 '전체 평균 차이' 계산 등에 유용합니다.

 

이렇게 Exclude 표현식도 배워보았는데요, 도움이 되셨나요?

다음 시간에는 Fixed 에 대해서 설명해 드리겠습니다.

그럼 또 만나요~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다 ^^

 

오늘은 'Include: 낮은 세부 수준에서 계산하기' 에 대해서 배워볼까 합니다~!

 

이 예에서는 표준 영업 데이터베이스(Tableau에서 제공되는 Superstore 데이터베이스)를 살펴보겠습니다.

여기서 각 행은 특정 항목의 매출을 나타냅니다.

Order(주문)에는 여러 항목이 포함될 수 있으며 주문은 여러 행에 나누어져 입력될 수 있습니다.

즉, 이 데이터베이스의 가장 깊은 수준의 세부 수준은 고유한 항목입니다.

 

데이터베이스 스냅샷의 첫 번째 행은 Bush Somerset Bookcase(부시 서머셋 책장) 2개에 대한 구매입니다.

두 번째 행은 Hon Stacking Chairs(혼 스태킹 의자) 3개에 대한 구매입니다.

이 두개의 행이 단일 주문인 주문 CA-2013-152156을 구성합니다.

지역별 영업 실적을 분석하고 있는 경우 평균 주문 규모가 가장 큰(또는 작은) 지역을 파악하려면 어떻게 해야할까요?

 

이 정보를 파악하려면 주문별 규모를 계산(각 Order ID에 해당하는 매출 합계를 산출)한 다음 해당 값에 대한

지역별 평균을 산출해야 합니다.

이 비즈니스 질문은 충분히 물어볼 가능성이 있는 질문이며 새로운 LOD 표현식 구문을 사용하면 Tableau에서

이에 대한 답변을 쉽게 구할 수 있습니다.

 

다음은 새로운 구문에 대한 좀 세부적인 설명입니다.

 

{INCLUDE [Order ID] : SUM([Sales])}

LOD 표현식은 여기서 볼 수 있는 것처럼 계산 에디터에서 작성할 수 있습니다. 이 LOD 표현식은 각 Order ID별 구매

합계를 구하기 위해 사용되었습니다. 그 결과는 Order Size(주문 규모)라는 새로운 필드입니다.

 

왼쪽의 막대는 LOD 표현식으로 계산된 Region(지역)별 평균 주문 규모를 보여주는 반면 ,

오른쪽의 막대는 Region(지역)별 평균 Sales(매출)을 보여줍니다.

예를 들어 주문관 상관없이 모든 주문라인 항목의 평균). 이제 다음 질문에 대한 답변을 구할 수 있습니다.

평균 주문 규모가 가장 큰 Region(지역)은 어디입니까?

 

북부 아시아와 중부 아시아가 각각 $737 및 $733로 평균 Order Size(주문 규모)가 가장 크다는 것을 볼 수 있습니다.

비쥬얼라이제이션에 Order ID(주문 ID)가 표시되지 않음에도 불구하고 이 정보를 파악할 수 있습니다.

(Tableau버전9 이전에는 뷰에 Order ID(주문 ID)를 추가하지 않고 해당 값을 계산할 수 없었습니다.)

그림의 오른쪽 막대에서 볼 수 있듯이 Region(지역) 및 AVG(Sales)를 표시했다면 원하는 결과가 아닌 Region(지역)별

모든 라인 항목의 평균이 표시되었을 것입니다.

반면에 Order Size(주문 규모)에 대한 LOD 표현식의 경우 주문별 규모를 먼저 구한 다음 (즉, 주문 내 모든 라인 항목의

매출합계) 해당 주문 결과에 대한 Region(지역)별 평균을 구해 Region(지역)별 Order Size(주문규모)를 구할 수 있습니다.

 

이제 평균 주문 규모가 가장 큰 지역을 파악했으니 조금 더 복잡한 질문을 해보겠습니다.

 

영업 데이터베이스에 있는 국가 중 평균적으로 '규모가 가장 큰 거래'를 성사시키는 영업 담당자들이 속한 국가가

어느 곳입니까? 수행하려는 작업은 다음과 같습니다.

1. 영업 담당자별 성사시킨 가장 규모가 큰 거래(최대값 거래)를 찾은 다음

2. 해당 '최대 규모 거래'에 대한 국가별 평균을 구합니다.

이 질문에는 여러 측면이 있지만 LOD 표현식을 사용하면 답변을 쉽게 구할 수 있습니다.

 

AVG({INCLUDE [Sales Rep] : MAX([Sales])})

Avg Largest Sales Deal by Rep(담당자별 평균 최대 규모 영업 거래)라는 LOD 표현식이 영업 담당자별 평균 최대값

거래를 계산하기 위해 사용되었습니다. 이 경우 LOD 표현식의 평균이 계산 에디터 창에 직접 입력됩니다.

 

 

이 질문에 대한 답변은 복잡한 수식 없이 하나의 표현식인 AVG({INCLUDE [Sales Rep] : MAX([Sales])})로 구할 수

있었습니다. 실제로 뷰에 차원을 추가하여 데이터에 대한 추가 질문을 할 수도 있으며 이 경우 계산이 업데이트됩니다.

예를 들어, 분석에 Year(연도)를 추가해 보겠습니다.

 

 

계산에서 INCLUDE 키워드를 사용하면 Sales Rep(영업 담당자) 필드가 계산에 명시적으로 포함되지만

비쥬얼라이제이션에 배치된 모든 다른 차원도 포함됩니다. (이 경우 Country(국가) 및 Year(연도)).

뷰에 Year(연도)를 추가하면 분석을 더욱 깊이 있게 수행하여 다음과 같은 정보를 얻을 수 있습니다.

2012년에는 바레인의 평균 '최대 규모 거래'가 $4,069로 가장 높았습니다.

 

다음 흐름 도표는 Tableau에서 INCLUDE LOD 표현식이 수행되는 방법을 시각적으로 설명합니다.

 

INCLUDE 키워드는 비쥬얼라이제이션 LOD에 비해 집계 수준이 낮은 (즉, 더 세부적인) 표현식을 만듭니다.

지정된 차원은 계산이 수행되기 전에 비쥬얼라이제이션 LOD에 먼저 추가됩니다.

INCLUDE 표현식은 뷰에서 집계된 측정값으로 사용되었습니다.

실제로 모든 INCLUDE 표현식은 뷰에 배치될 때 측정값 또는 집계된 측정값으로 사용됩니다.

 

다음 시간에는 Exclude 를 배워보도록 하겠습니다.

오늘도 수고하셨습니다 ^^ 다음에 또 만나요~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

+ Recent posts