태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요 , 디포커스 태블로 둥이입니다.

오늘은 'Fixed: 정확한 세부 수준 지정하기'에 대하여 설명 드리겠습니다.

LOD 표현식을 사용하면 비쥬얼라이제이션 LOD와 완전하게 독립적으로 집계 수준을 만들 수 있습니다.

이전에는 맞춤 SQL을 통해서만 이러한 작업을 수행할 수 있었습니다.

YELP 데이터를 분석하여 비즈니스의 첫 리뷰가 작성된 연도별 집단을 찾으려 한다고 가정해 보겠습니다.

각 집단의 리뷰 트렌드가 동일합니까?

LOD 표현식을 사용하면 정확한 세부 수준에서 집단을 지정할 수 있습니다.

 

{FIXED [Business - Id] : MIN(YEAR([Review Date]))}

LOD 표현식은 Business ID별로 세부 수준을 고정합니다.

그런 다음 Business ID별 모든 리뷰에서 Review Date(리뷰 날짜)의 최소 Year(연도)를 찾고

해당 값을 Business ID와 연결합니다. First Review Year(첫 리뷰 연도)를 데이터베이스의 새 열로 간주할 수 있습니다.

 

비주얼라이제이션에서 이 필드를 사용할 때 계산 범위가 표현식에 암시적으로 정의됩니다.

아래에 표시된 것과 같이 각 Business ID(비즈니스 ID)First Review Year(첫 리뷰 연도)가 기록되면

집단을 탐색하여 정보를 얻을 수 있습니다.

 

 

 

 

FIXED 키워드를 사용하면 계산의 집계 수준을 구체적으로 정의할 수 있습니다.

INCLUDE EXCLUDE와 달리 비주얼라이제이션에서 사용되는 차원과 독립적으로 수행됩니다.

FIXED 표현식의 결과는 FIXED 차원과 비주얼라이제이션 LOD의 관계에 따라 비주얼라이제이션 LOD보다

광범위하거나 세부적일 수 있습니다.

 

 

First Review Year(첫 리뷰 연도)를 필터로 사용해 보겠습니다.

 

각 연도별 집단에는 차원형구간차원이 지정되었습니다.

, First Review Year (첫 리뷰 연도)가 뷰에서 차원으로 사용되습니다.

FIXED 표현식은 차원 또는 측정값으로 사용할 수 있습니다.

Tableau는 데이터 유형에 따라 계산 결과를 차원 또는 측정값으로 지정합니다.

INCLUDE/EXCLUDE FIXED의 주요 차이점은 아래 표시된 것과 같이 필터링 계층 상의 각 위치입니다.

FIXED LOD 표현식은 차원 필터 전 및 컨텍스트 필터 후에 계산됩니다. 여러 사용 사례에서 이를 활용할 수 있습니다.

 

다음 시간에는 사례에 대해서 배워보도록 하겠습니다.

다음에 뵙겠습니다~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

 

안녕하세요, 디포커스 태블로 둥이입니다~!

'Exclude: 더 높은 세부 수준에서 계산하기' 에 대해서 배워보도록 하겠습니다.

 

다음 시나리오를 가정해 보십시오.

월별 총 Sales(매출) 및 Region(지역)별 총 매출을 확인하려고 합니다. 그러면 다음을 수행해야 합니다.

1. 월별 Total Sales(총 매출) 계산에서 Region(지역)을 제외해야 합니다.

2. 그런 다음 지역별 Sales(매출) 세부 정보를 계산할 때 Region(지역)을 포함해야 합니다.

 

앞서 설명한 영업 데이터베이스를 사용하여 또 다른 예제를 살펴보겠습니다.

 

 

{EXCLUDE [Region] : SUM([Sales])}

Total Sales(총 매출)라는 이 LOD 표현식을 사용하면 모든 지역의 월별 총 매출을 계산할 수 있습니다.

 

위 비주얼라이제이션에서는 Region(지역)이 열 선반에 배치되어 Region(지역), Month()(Order Date(주문일))

비주얼라이제이션 LOD에 영향을 미칩니다.

EXCLUDE 표현식을 사용하면 총 매출을 계산(모든 지역)하면서 지역별 매출 세부 정보를 표시할 수 있습니다.

이에 따라 다음과 같이 비주얼라이제이션 LOD에 비해 상위수준에 있는(, 덜 세부적인) LOD 표현식을 만들었습니다.

 

EXCLUDE 키워드의 핵심은 다음과 같습니다.

Tableau에서는 먼저 비주얼라이제이션 LOD에서 제외된 차원을 삭제하고 해당 차원이 없는 것으로 간주하고

계산을 수행합니다. 그런 다음 그 결과가 시각적으로 표시됩니다.

 

다음 흐름 도표는 Tableau에서 EXCLUDE LOD 표현식이 수행되는 방법에 대한 시각적인 설명입니다.

 

{EXCLUDE [Region] : SUM([Sales])}이라는 표현식을 사용하면 TableauRegion(지역)차원을 제외하고

비주얼라이제이션에서 사용된 모든 차원을 사용하여 매출 합계를 계산합니다.

따라서 모든 지역의 총 매출을 나타내는 월별 단일 값이 산출됩니다.

 

이제 SUM 집계를 사용하는 Total Sales(총 매출) Region(지역)Sales(매출)모두 보여주는 강력한 뷰가 있습니다.

집계를 조합할 수도 있습니다.

예를 들어, LOD 표현식을 변경하여 지역별 합계를 표시하면서 월별 평균 Sales(매출)을 표시하도록 해보겠습니다.

 

 

INCLUDE 표현식과 유사하게 모든 EXCLUDE 표현식은 뷰에 배치될 때 측정값 또는 집계된 측정값으로 사용됩니다.

이러한 유형의 표현식은 '구성 비율' 또는 '전체 평균 차이' 계산 등에 유용합니다.

 

이렇게 Exclude 표현식도 배워보았는데요, 도움이 되셨나요?

다음 시간에는 Fixed 에 대해서 설명해 드리겠습니다.

그럼 또 만나요~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다 ^^

 

오늘은 'Include: 낮은 세부 수준에서 계산하기' 에 대해서 배워볼까 합니다~!

 

이 예에서는 표준 영업 데이터베이스(Tableau에서 제공되는 Superstore 데이터베이스)를 살펴보겠습니다.

여기서 각 행은 특정 항목의 매출을 나타냅니다.

Order(주문)에는 여러 항목이 포함될 수 있으며 주문은 여러 행에 나누어져 입력될 수 있습니다.

즉, 이 데이터베이스의 가장 깊은 수준의 세부 수준은 고유한 항목입니다.

 

데이터베이스 스냅샷의 첫 번째 행은 Bush Somerset Bookcase(부시 서머셋 책장) 2개에 대한 구매입니다.

두 번째 행은 Hon Stacking Chairs(혼 스태킹 의자) 3개에 대한 구매입니다.

이 두개의 행이 단일 주문인 주문 CA-2013-152156을 구성합니다.

지역별 영업 실적을 분석하고 있는 경우 평균 주문 규모가 가장 큰(또는 작은) 지역을 파악하려면 어떻게 해야할까요?

 

이 정보를 파악하려면 주문별 규모를 계산(각 Order ID에 해당하는 매출 합계를 산출)한 다음 해당 값에 대한

지역별 평균을 산출해야 합니다.

이 비즈니스 질문은 충분히 물어볼 가능성이 있는 질문이며 새로운 LOD 표현식 구문을 사용하면 Tableau에서

이에 대한 답변을 쉽게 구할 수 있습니다.

 

다음은 새로운 구문에 대한 좀 세부적인 설명입니다.

 

{INCLUDE [Order ID] : SUM([Sales])}

LOD 표현식은 여기서 볼 수 있는 것처럼 계산 에디터에서 작성할 수 있습니다. 이 LOD 표현식은 각 Order ID별 구매

합계를 구하기 위해 사용되었습니다. 그 결과는 Order Size(주문 규모)라는 새로운 필드입니다.

 

왼쪽의 막대는 LOD 표현식으로 계산된 Region(지역)별 평균 주문 규모를 보여주는 반면 ,

오른쪽의 막대는 Region(지역)별 평균 Sales(매출)을 보여줍니다.

예를 들어 주문관 상관없이 모든 주문라인 항목의 평균). 이제 다음 질문에 대한 답변을 구할 수 있습니다.

평균 주문 규모가 가장 큰 Region(지역)은 어디입니까?

 

북부 아시아와 중부 아시아가 각각 $737 및 $733로 평균 Order Size(주문 규모)가 가장 크다는 것을 볼 수 있습니다.

비쥬얼라이제이션에 Order ID(주문 ID)가 표시되지 않음에도 불구하고 이 정보를 파악할 수 있습니다.

(Tableau버전9 이전에는 뷰에 Order ID(주문 ID)를 추가하지 않고 해당 값을 계산할 수 없었습니다.)

그림의 오른쪽 막대에서 볼 수 있듯이 Region(지역) 및 AVG(Sales)를 표시했다면 원하는 결과가 아닌 Region(지역)별

모든 라인 항목의 평균이 표시되었을 것입니다.

반면에 Order Size(주문 규모)에 대한 LOD 표현식의 경우 주문별 규모를 먼저 구한 다음 (즉, 주문 내 모든 라인 항목의

매출합계) 해당 주문 결과에 대한 Region(지역)별 평균을 구해 Region(지역)별 Order Size(주문규모)를 구할 수 있습니다.

 

이제 평균 주문 규모가 가장 큰 지역을 파악했으니 조금 더 복잡한 질문을 해보겠습니다.

 

영업 데이터베이스에 있는 국가 중 평균적으로 '규모가 가장 큰 거래'를 성사시키는 영업 담당자들이 속한 국가가

어느 곳입니까? 수행하려는 작업은 다음과 같습니다.

1. 영업 담당자별 성사시킨 가장 규모가 큰 거래(최대값 거래)를 찾은 다음

2. 해당 '최대 규모 거래'에 대한 국가별 평균을 구합니다.

이 질문에는 여러 측면이 있지만 LOD 표현식을 사용하면 답변을 쉽게 구할 수 있습니다.

 

AVG({INCLUDE [Sales Rep] : MAX([Sales])})

Avg Largest Sales Deal by Rep(담당자별 평균 최대 규모 영업 거래)라는 LOD 표현식이 영업 담당자별 평균 최대값

거래를 계산하기 위해 사용되었습니다. 이 경우 LOD 표현식의 평균이 계산 에디터 창에 직접 입력됩니다.

 

 

이 질문에 대한 답변은 복잡한 수식 없이 하나의 표현식인 AVG({INCLUDE [Sales Rep] : MAX([Sales])})로 구할 수

있었습니다. 실제로 뷰에 차원을 추가하여 데이터에 대한 추가 질문을 할 수도 있으며 이 경우 계산이 업데이트됩니다.

예를 들어, 분석에 Year(연도)를 추가해 보겠습니다.

 

 

계산에서 INCLUDE 키워드를 사용하면 Sales Rep(영업 담당자) 필드가 계산에 명시적으로 포함되지만

비쥬얼라이제이션에 배치된 모든 다른 차원도 포함됩니다. (이 경우 Country(국가) 및 Year(연도)).

뷰에 Year(연도)를 추가하면 분석을 더욱 깊이 있게 수행하여 다음과 같은 정보를 얻을 수 있습니다.

2012년에는 바레인의 평균 '최대 규모 거래'가 $4,069로 가장 높았습니다.

 

다음 흐름 도표는 Tableau에서 INCLUDE LOD 표현식이 수행되는 방법을 시각적으로 설명합니다.

 

INCLUDE 키워드는 비쥬얼라이제이션 LOD에 비해 집계 수준이 낮은 (즉, 더 세부적인) 표현식을 만듭니다.

지정된 차원은 계산이 수행되기 전에 비쥬얼라이제이션 LOD에 먼저 추가됩니다.

INCLUDE 표현식은 뷰에서 집계된 측정값으로 사용되었습니다.

실제로 모든 INCLUDE 표현식은 뷰에 배치될 때 측정값 또는 집계된 측정값으로 사용됩니다.

 

다음 시간에는 Exclude 를 배워보도록 하겠습니다.

오늘도 수고하셨습니다 ^^ 다음에 또 만나요~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~ 디포커스 태블로 둥이입니다 ^^

 

오늘 시간은 익숙하고 많이 봤을 막대 그래프입니다.

측정값에 대해서 차원값의 많고 적음을 한 눈에 알아보기 참 쉽죠잉~ 그림을 통해 알아볼까요?

 

 

대분류-중분류 계층 구조로 매출 값에 대한 순위를 알 수가 있습니다.

또한 수익을 색상으로 표현하여 가구의 테이블 분야는 수익이 -인 것을 파악할 수 있습니다.

 

이번엔 다른 형태의 막대 그래프를 알아볼까요?

중분류에 대한 매출값 그래프를 세그먼트 누적값을 통해 나타내어 보았습니다.

 

마지막으로 다른 형태의 막대 그래프를 분석해 보겠습니다.

국가별 수익 순위를 나타내어 보았습니다.

 

이처럼 막대 그래프의 특징은 측정 값을 빠르게 비교 분석할 수 있습니다.

 

다음 이 시간에 또 만나용~~~~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다^^

 

인기 많은 차트 중에 하나인 파이 차트에 대해서 알아보겠습니다.

파이 차트는 차원값에 대한 구성비율을 나타내는 가장 좋은 그래프입니다.

 

 

위와 같이 지역별 매출을 비교하여 구성 비율을 나타내기 좋은 그래프입니다.

 

또한 매출값이 아니라 지역 전체 값에 대한 구성 비율로도 나타낼 수 있습니다.

 

마지막으로 좀 더 이쁘게 정리 한 번 해볼까용?

 

 

이와 같이 구성비율과 매출값도 같이 사용할 수 있고 대분류로도 구분하여 나타내 보았습니다.

 

다양한 태블로의 그래프 신세계 한 번 배워보고 싶지 않으신가용?

다음 시간엔 어떤 그래프가 기다릴까용....? ^^*

 

다음 시간에 만나용~~~~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다 ^^

 

이번 시간에 알아볼 그래프는 지도 그래프입니다.

지리적 정보를 한 눈에 알아보기 쉬운 그래프입니다.

 

 

이렇게 국가/지역별로 매출과 수익을 지도 형태인 차트로 한 눈에 알아볼 수 있습니다.

 

이번에는 다른 형태인 지도 모양으로 알아보겠습니다.

 

 

국가별 매출이 대분류의 비율이 얼만큼 차지하는지 알 수 있는 지도 형태의 그래프를 알아보았습니다.

 

여기서 한발짜악~ 더 나아가서 두 그래프를 같이 본다면.......

 

 

북아시아 지역에 매출을 대분류로 구분하고 수익값을 색으로 통해 볼 수 있는 차트를 만들어 보았습니다.

 

태블로에서 제공하는 위도,경도값은 자동으로 시군구까지 표현할 수가 있고 좌표값만 있으면 더 자세한 지역까지

표현할 수 있는 맵 기능을 갖췄습니다.

 

지도 맵을 잘 활용해서 다양한 분석을 하고 싶지 않으신가용?

 

다음 이 시간엔 더 활용적인 그래프로 돌아오겠습니다~!!!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다 ^^

 

태블로 차트를 알아보는 세 번째 시간입니다.

오늘 알아볼 차트는 테이블 형식의 마지막인 하이라이트 테이블입니다.

그림으로 만나볼까요?

 

 

저번 시간에 봤던 열지도와 비슷한 형태입니다.

마치 텍스트 테이블과 열지도를 합쳐 놓은 듯한 테이블입니다.

주문날짜에 대한 대분류 , 중분류가 텍스트로 매출을 색상으로 수익을 파악할 수가 있습니다.

가구의 테이블값이 4년 동안 계속 -값을 내고 있는 것을 색구분을 통해 빠르게 알 수 있습니다.

 

두 그래프의 장점을 합친 하이라이트 그래프입니다.

 

다음 이 시간에는 테이블 형태가 아닌 다른 형태의 그래프를 알아보는 시간을 갖도록 하겠습니다.

 

감사합니다~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다 ^^

 

태블로 차트를 알아보는 두 번째 '열지도(heat map) 란 차트' 시간입니다.

처음 들어보셔서 생소할텐데 그림으로 보겠습니다.

 

 

이전 시간에 본 텍스트 테이블 안에 텍스트 대신 차원 값을 색상으로 표현하여 차원값 범위를

색상의 범례로 표현한 것입니다.

 

이 그래프 특징은 행,열 구분으로 어디가 높은 지점인지 또 어디가 낮은 지점인지 직관적으로 파악할 수 있는

장점이 있는 테이블입니다.

 

한 단계 더 알아볼까요?

 

 

매출값을 색상으로 표현했다면, 동시에 수익값을 크기로 표현해 보았습니다.

어느 세그먼트 , 지역에 있는 제조사가 색상을 통해 매출을 크기로 통해 수익을 알아볼 수 있는 차트를 만들게

되었습니다.

 

이렇게 데이터의 관계를 텍스트가 아닌 색으로 빠르게 파악할 수 있는 열지도(heat map)이 장점입니다.

 

다음 이 시간에는 더 재미있는 그래프로 찾아 뵙겠습니다. *^^*

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~ 디포커스 태블로 둥이입니다. ^^

 

태블로 차트를 알아보는 첫 번째 시간입니다.

가장 기본이 되는 텍스트 테이블 차트를 알아보겠습니다.

 

 

텍스트 테이블 차트는 엑셀과 같은 형태로 보는 방법입니다.

테이블 형태의 차트로 다양한 방법으로 만들 수 있지만 가장 기본이 되는 예시로 만들어 보았습니다.

 

보고 싶은 부분의 차원 값을 열,행으로 표현하고 차원 값에 대한 측정값을 올리면 위 그래프처럼 만들 수 있습니다.

또 분석에서 총합계 같은 값도 자동 계산해서 볼 수 있습니다.

 

그렇다면 텍스트 테이블 차트로 보는 이유와 장점이 무엇이 있을까요?

 

보고 싶은 차원 값과 측정값을 한 테이블로 볼 수 있습니다.

총계를 쉽게 표현할 수가 있고 엑셀보다 손쉽게 피벗을 할 수가 있습니다.

 

자~~ 그럼 이번엔 다른 차원 값으로 테이블을 구성하여 측정값을 비교해 볼까요?

 

 

차원값 세그먼트, 지역 그리고 주문날짜를 사용하여 수익과 매출값을 비교해 보았습니다.

텍스트 테이블은 여기까지 다음 시간에는 더 유용한 차트로 찾아뵙겠습니다~~

 

감사합니다. *^^*

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

 

안녕하세요~ 디포커스 태블로 둥이입니다. ^^

지금 이순간에도 데이터는 빠른 속도로 쌓이고 있지요?

태블로는 데이터 시각화를 통해 효과적인 분석을 가능하게 도와줍니다.

그런 다양한 분석을 할 수 있게 사용되는 것이 바로 차트입니다.

같은 데이터라도 다른 형태의 차트로 본다면 전혀 다른 인사이트를 얻을 것입니다.

그만큼 중요한 것이 차트인데 태블로는 약 24개의 차트를 측정값과 차원값을 가지고 클릭 한 번을

통해 차트를 만들 수 있습니다.

다음 이 시간부턴 태블로에서 제공되는 기본 차트와 다양한 차트를 만들어 보는 시간을 갖도록 하겠습니다~

감사합니다 ^^

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

+ Recent posts