태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다 ^^

 

오늘은 'Include: 낮은 세부 수준에서 계산하기' 에 대해서 배워볼까 합니다~!

 

이 예에서는 표준 영업 데이터베이스(Tableau에서 제공되는 Superstore 데이터베이스)를 살펴보겠습니다.

여기서 각 행은 특정 항목의 매출을 나타냅니다.

Order(주문)에는 여러 항목이 포함될 수 있으며 주문은 여러 행에 나누어져 입력될 수 있습니다.

즉, 이 데이터베이스의 가장 깊은 수준의 세부 수준은 고유한 항목입니다.

 

데이터베이스 스냅샷의 첫 번째 행은 Bush Somerset Bookcase(부시 서머셋 책장) 2개에 대한 구매입니다.

두 번째 행은 Hon Stacking Chairs(혼 스태킹 의자) 3개에 대한 구매입니다.

이 두개의 행이 단일 주문인 주문 CA-2013-152156을 구성합니다.

지역별 영업 실적을 분석하고 있는 경우 평균 주문 규모가 가장 큰(또는 작은) 지역을 파악하려면 어떻게 해야할까요?

 

이 정보를 파악하려면 주문별 규모를 계산(각 Order ID에 해당하는 매출 합계를 산출)한 다음 해당 값에 대한

지역별 평균을 산출해야 합니다.

이 비즈니스 질문은 충분히 물어볼 가능성이 있는 질문이며 새로운 LOD 표현식 구문을 사용하면 Tableau에서

이에 대한 답변을 쉽게 구할 수 있습니다.

 

다음은 새로운 구문에 대한 좀 세부적인 설명입니다.

 

{INCLUDE [Order ID] : SUM([Sales])}

LOD 표현식은 여기서 볼 수 있는 것처럼 계산 에디터에서 작성할 수 있습니다. 이 LOD 표현식은 각 Order ID별 구매

합계를 구하기 위해 사용되었습니다. 그 결과는 Order Size(주문 규모)라는 새로운 필드입니다.

 

왼쪽의 막대는 LOD 표현식으로 계산된 Region(지역)별 평균 주문 규모를 보여주는 반면 ,

오른쪽의 막대는 Region(지역)별 평균 Sales(매출)을 보여줍니다.

예를 들어 주문관 상관없이 모든 주문라인 항목의 평균). 이제 다음 질문에 대한 답변을 구할 수 있습니다.

평균 주문 규모가 가장 큰 Region(지역)은 어디입니까?

 

북부 아시아와 중부 아시아가 각각 $737 및 $733로 평균 Order Size(주문 규모)가 가장 크다는 것을 볼 수 있습니다.

비쥬얼라이제이션에 Order ID(주문 ID)가 표시되지 않음에도 불구하고 이 정보를 파악할 수 있습니다.

(Tableau버전9 이전에는 뷰에 Order ID(주문 ID)를 추가하지 않고 해당 값을 계산할 수 없었습니다.)

그림의 오른쪽 막대에서 볼 수 있듯이 Region(지역) 및 AVG(Sales)를 표시했다면 원하는 결과가 아닌 Region(지역)별

모든 라인 항목의 평균이 표시되었을 것입니다.

반면에 Order Size(주문 규모)에 대한 LOD 표현식의 경우 주문별 규모를 먼저 구한 다음 (즉, 주문 내 모든 라인 항목의

매출합계) 해당 주문 결과에 대한 Region(지역)별 평균을 구해 Region(지역)별 Order Size(주문규모)를 구할 수 있습니다.

 

이제 평균 주문 규모가 가장 큰 지역을 파악했으니 조금 더 복잡한 질문을 해보겠습니다.

 

영업 데이터베이스에 있는 국가 중 평균적으로 '규모가 가장 큰 거래'를 성사시키는 영업 담당자들이 속한 국가가

어느 곳입니까? 수행하려는 작업은 다음과 같습니다.

1. 영업 담당자별 성사시킨 가장 규모가 큰 거래(최대값 거래)를 찾은 다음

2. 해당 '최대 규모 거래'에 대한 국가별 평균을 구합니다.

이 질문에는 여러 측면이 있지만 LOD 표현식을 사용하면 답변을 쉽게 구할 수 있습니다.

 

AVG({INCLUDE [Sales Rep] : MAX([Sales])})

Avg Largest Sales Deal by Rep(담당자별 평균 최대 규모 영업 거래)라는 LOD 표현식이 영업 담당자별 평균 최대값

거래를 계산하기 위해 사용되었습니다. 이 경우 LOD 표현식의 평균이 계산 에디터 창에 직접 입력됩니다.

 

 

이 질문에 대한 답변은 복잡한 수식 없이 하나의 표현식인 AVG({INCLUDE [Sales Rep] : MAX([Sales])})로 구할 수

있었습니다. 실제로 뷰에 차원을 추가하여 데이터에 대한 추가 질문을 할 수도 있으며 이 경우 계산이 업데이트됩니다.

예를 들어, 분석에 Year(연도)를 추가해 보겠습니다.

 

 

계산에서 INCLUDE 키워드를 사용하면 Sales Rep(영업 담당자) 필드가 계산에 명시적으로 포함되지만

비쥬얼라이제이션에 배치된 모든 다른 차원도 포함됩니다. (이 경우 Country(국가) 및 Year(연도)).

뷰에 Year(연도)를 추가하면 분석을 더욱 깊이 있게 수행하여 다음과 같은 정보를 얻을 수 있습니다.

2012년에는 바레인의 평균 '최대 규모 거래'가 $4,069로 가장 높았습니다.

 

다음 흐름 도표는 Tableau에서 INCLUDE LOD 표현식이 수행되는 방법을 시각적으로 설명합니다.

 

INCLUDE 키워드는 비쥬얼라이제이션 LOD에 비해 집계 수준이 낮은 (즉, 더 세부적인) 표현식을 만듭니다.

지정된 차원은 계산이 수행되기 전에 비쥬얼라이제이션 LOD에 먼저 추가됩니다.

INCLUDE 표현식은 뷰에서 집계된 측정값으로 사용되었습니다.

실제로 모든 INCLUDE 표현식은 뷰에 배치될 때 측정값 또는 집계된 측정값으로 사용됩니다.

 

다음 시간에는 Exclude 를 배워보도록 하겠습니다.

오늘도 수고하셨습니다 ^^ 다음에 또 만나요~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요 , 디포커스 태블로 둥이입니다.

오늘은 세부 수준(LOD) 표현식을 설명해 드리려고 합니다.

 

Tableau에서는 데이터 분석을 통해 즐거운 경험을 하게 만드는 것을 목표로 삼고 있습니다.

문제를 해결하기 위해 도구를 사용하는 방법에 대해 고민해야 한다면 흐름이 깨집니다.

질문하는 것은 간단하지만, 답변을 구하는 과정에는 어려움이 따릅니다.

 

예는 다음과 같습니다.

* 분기별로 회사의 주문이 100개 이상이었던 일 수를 파악할 수 있습니까?

* 영업 담당자별로 성사된 거래 중 규모가 가장 큰 거래를 찾고 관리자별 평균을 파악할 수 있습니까?

* 각 고객에게 처음 고객이 된 연도를 태그로 지정한 다음, 해당 태그를 사용하여 매출을 그룹화할 수 있습니까?

 

Tableau 에서는 이러한 질문에 대한 답변을 찾을 수 있도록 세부 수준(LOD) 표현식이라는 새로운 구문을 도입했습니다.

 

LOD 표현식의 작동 방법 ㅡ '세부 수준' 설명

데이터 탐색의 핵심은 원본의 구조를 이해하는 데 있습니다.

예를 들어 가장 세부적인 수준이 주소별로 나열된 레스토랑 검사 데이터가 있다고 가정해 보겠습니다.

데이터를 집계하여 우편 번호, 구/군/시, 시/도 또는 국가별로 속성을 확인해 보려고 합니다.

 

Tableau에서는 원하는 차원(예: 구/군/시, 시/도)을 뷰에 드롭하여 이러한 작업을 수행할 수 있습니다.

뷰에 추가한 차원에 따라 데이터가 '비쥬얼라이제이션 세부 수준' 즉, 비쥬얼라이제이션 LOD로 집계됩니다.

 

(비쥬얼라이제이션 LOD를 변경함)

하이라이트된 선반에 차원을 배치하면 비쥬얼라이제이션 LOD에 추가됩니다.

 

(비쥬얼라이제이션 LOD를 변경하지 않음)

차원을 페이지, 필터 및 도구 설명 선반에 배치하면 비쥬얼라이제이션 LOD에 추가되지 않습니다.

시각적으로 표시하지 않으면서 뷰에 있는 데이터를 수정할 수 있습니다.

 

요점을 말씀 드리겠습니다~!

 

LOD 표현식을 사용하면 세부 수준(예: 차원)을 비쥬얼라이제이션에 실제로 드롭하지 않고도

계산에서 사용되는 세부 수준을 결정할 수 있습니다.

 

레스토랑 검사 데이터를 사용하는 다음 대시보드의 경우, 뷰에 두 개의 차원이 추가되었습니다.

 

뷰에 더욱 세부적인 차원을 추가하면 비쥬얼라이제이션 LOD의 집계 수준이 낮아집니다.

예를 들어,

Business ID를 세부 정보 선반에 드롭하여 비쥬얼라이제이션에 추가하면 비즈니스별 평균 사용자층을 볼 수 있습니다.

이렇게 하면 비쥬얼라이제이션도 변경됩니다. 개별 비즈니스가 맵에서 원으로 표시됩니다.

 

하지만 ..... 비쥬얼라이제이션을 변경하지 않으려면 어떻게 해야 할까요?

비즈니스 ID별 총 고객층을 결정하고 구/군/시별 해당 값의 평균을 구하고 구/군/시별로 원을 하나씩만 표시하려면

어떻게 해야 할까요?

 

구/군/시별 각 레스토랑의 평균 고객 수를 파악하려고 합니다. 이렇게 하려면 비쥬얼라이제이션에 차원을 드래그하지

않고 뷰에 차원을 추가해야 합니다. LOD 표현식을 사용하면 이 작업을 수행할 수 있습니다.

 

Fans per Business(비즈니스별 고객 수)라는 새 계산된 필드를 만들어 보겠습니다.

 

{FIXED [Business ID] : SUM([User Fans])}

 

이 표현식을 사용하면 비쥬얼라이제이션에 사용된 다른 차원과 관계없이 Tableau에서 각 Business ID에 대한 집계를

수행합니다. LOD 표현식을 사용하여 Business ID별 총 User Fans(사용자 수)를 계산할 수 있습니다.

이 새 필드를 뷰에 드래그한 다음 구/군/시별 해당 값에 대한 평균을 구할 수 있습니다.

 

LOD 표현식에 FIXED 연산자를 사용하면 Business ID(비즈니스 ID)별로 평균 사용자가 더 많은 구/군/시에 대한 정보를

얻을 수 있습니다. 즉, 파란색이 더 진한 구/군/시는 인기 있는 레스토랑이 더 많다(또는 해당 구/군/시의 인구가 더 많고

이에 따라 레스토랑별 사용자가 더 많음)는 것을 의미합니다.

 

LOD 표현식 키워드에는 EXCLUDE, INCLUDE, FIXED 등 3가지 유형이 있으며

각 키워드로 LOD 표현식의 범위를 다르게 지정할 수 있습니다.

 

그럼 다음 시간에는 INCLUDE  에 대해서 배워보겠습니다~!

감사합니다. *^^*

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~ 디포커스 태블로 둥이입니다~! ^^

 

오늘 알아볼 차트는 영역 차트입니다.

라인 차트랑 비슷하게 시계열 추이를 보는 차트이지만, 일반적인 추이보다는 영역을 색깔로

채우는 개념이기 때문에 측정값을 누적해서 보는 경우에 주로 사용하게 됩니다.

연도별 매출 누적값을 대분류 별로 표현해 보았습니다.

 

연도별 그래프를 분기별로 더 자세하게 매출값이 누적되었는지 알아볼까요?

연속형 날짜, 분기별로 나타내어 매출의 누적값을 영역 그래프로 나타낼 수 있습니다.

 

그럼 다음 이 시간에 새로운 차트로 또 만나요~~~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~ 디포커스 태블로 둥이입니다 ^^

 

오늘은 라인+막대의 이중축 차트를 알아보겠습니다.

말 그대로 2개 있는 차트입니다. 그림에서 봐볼까용?

왼쪽은 매출값의 막대 그래프 , 오른쪽은 매출값의 라인그래프입니다.

이중축을 사용하면 두 개의 차원 값을 동시에 볼 수 있습니다.

 

다른 형태의 이중 축 그래프를 알아볼까요?

두 개의 차원 값을 동시에 볼 수도 있지만 위와 같이 한 개의 차원값을 이중축으로 표현해서

한 개의 차원값을 더 직관적으로 표현할 수 있습니다. 이중축의 활용 방법은 다양합니다 ^^

 

앞으로 이중축 관련된 다양한 그래프를 소개해 드릴테니 태블로 공부를 같이 열심히 해 보아요~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~ 디포커스 태블로 둥이입니다 ^^

 

오늘 알아볼 그래프는 막대 그래프와 더불어 가장 많이 사용하는 라인 그래프입니다.

시계열 변화를 볼 때 가장 많이 사용합니다.

 

 

대분류 매출에 대한 월별 변화 추이를 나타냅니다.

태블로는 년-분기-월-일 계층구조로 표현할 수 있으며 위처럼 불연속처럼 볼 수 있고

또한 아래와 같이 연속적으로 날짜를 표현하여 볼 수도 있습니다.

 

그리고 태블로는 시계열에대한 예측 분석도 가능합니다.

위처럼 2019년 12월까지 나와 있는 데이터 그래프를 분석과 예측을 하여 1년치의 매출값을 출력해줍니다.

 분석>예측>예측설명 탭에서 해당 대분류값이 어떤 식으로 사용되어서 예측되어 있는지 설명해줍니다.

 

이렇게 라인 그래프를 사용하여 시계열 차원값에 측정 값에 대한 변화율을 볼 수 있습니다.

다음 이 시간에는 라인+막대 그래프를 동시에 나타내는 방법을 배워보겠습니다.

 

그럼 다음시간까지 안녕~~~~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~ 디포커스 태블로 둥이입니다 *^^*

 

오늘은 트리맵을 알아보겠습니다. 조금 생소하시지용? 바로 이것입니다!!!

각각에 중분류 매출에 대한 크기를 직사각형으로 표현하였습니다.

 

이처럼 트리맵이란,

차원값 기준으로 측정값을 직사각형 크기로 나타낸 것입니다.

 

위 그래프를 가지고 좀 더 자세하게 만들어 볼까요?

 

맨 처음 그래프를 세그먼트 별로 나누었고 한 눈에 보기 쉽게 순위값과 매출값을 동시에

출력하게 하였습니다.

 

그럼 다른 차원 값을 기준으로 만들어 볼까요?

연도별로 나누고 매출의 크기를 월별로 나눠서 색으로 표현했고 월별 매출 크기를 직사각형으로 표현했습니다.

 

데이터의 서로 다른 부분이 전체와 연결되는 방법을 한 눈에 확인하는 방법이 트리맵이었습니다.

 

다음에는 어떤 차트가 기다리고 있을까요~? *^^*

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~ 디포커스 태블로 둥이입니다 ^^

 

오늘 시간은 익숙하고 많이 봤을 막대 그래프입니다.

측정값에 대해서 차원값의 많고 적음을 한 눈에 알아보기 참 쉽죠잉~ 그림을 통해 알아볼까요?

 

 

대분류-중분류 계층 구조로 매출 값에 대한 순위를 알 수가 있습니다.

또한 수익을 색상으로 표현하여 가구의 테이블 분야는 수익이 -인 것을 파악할 수 있습니다.

 

이번엔 다른 형태의 막대 그래프를 알아볼까요?

중분류에 대한 매출값 그래프를 세그먼트 누적값을 통해 나타내어 보았습니다.

 

마지막으로 다른 형태의 막대 그래프를 분석해 보겠습니다.

국가별 수익 순위를 나타내어 보았습니다.

 

이처럼 막대 그래프의 특징은 측정 값을 빠르게 비교 분석할 수 있습니다.

 

다음 이 시간에 또 만나용~~~~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다^^

 

인기 많은 차트 중에 하나인 파이 차트에 대해서 알아보겠습니다.

파이 차트는 차원값에 대한 구성비율을 나타내는 가장 좋은 그래프입니다.

 

 

위와 같이 지역별 매출을 비교하여 구성 비율을 나타내기 좋은 그래프입니다.

 

또한 매출값이 아니라 지역 전체 값에 대한 구성 비율로도 나타낼 수 있습니다.

 

마지막으로 좀 더 이쁘게 정리 한 번 해볼까용?

 

 

이와 같이 구성비율과 매출값도 같이 사용할 수 있고 대분류로도 구분하여 나타내 보았습니다.

 

다양한 태블로의 그래프 신세계 한 번 배워보고 싶지 않으신가용?

다음 시간엔 어떤 그래프가 기다릴까용....? ^^*

 

다음 시간에 만나용~~~~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다 ^^

 

태블로 차트를 알아보는 세 번째 시간입니다.

오늘 알아볼 차트는 테이블 형식의 마지막인 하이라이트 테이블입니다.

그림으로 만나볼까요?

 

 

저번 시간에 봤던 열지도와 비슷한 형태입니다.

마치 텍스트 테이블과 열지도를 합쳐 놓은 듯한 테이블입니다.

주문날짜에 대한 대분류 , 중분류가 텍스트로 매출을 색상으로 수익을 파악할 수가 있습니다.

가구의 테이블값이 4년 동안 계속 -값을 내고 있는 것을 색구분을 통해 빠르게 알 수 있습니다.

 

두 그래프의 장점을 합친 하이라이트 그래프입니다.

 

다음 이 시간에는 테이블 형태가 아닌 다른 형태의 그래프를 알아보는 시간을 갖도록 하겠습니다.

 

감사합니다~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다 ^^

 

태블로 차트를 알아보는 두 번째 '열지도(heat map) 란 차트' 시간입니다.

처음 들어보셔서 생소할텐데 그림으로 보겠습니다.

 

 

이전 시간에 본 텍스트 테이블 안에 텍스트 대신 차원 값을 색상으로 표현하여 차원값 범위를

색상의 범례로 표현한 것입니다.

 

이 그래프 특징은 행,열 구분으로 어디가 높은 지점인지 또 어디가 낮은 지점인지 직관적으로 파악할 수 있는

장점이 있는 테이블입니다.

 

한 단계 더 알아볼까요?

 

 

매출값을 색상으로 표현했다면, 동시에 수익값을 크기로 표현해 보았습니다.

어느 세그먼트 , 지역에 있는 제조사가 색상을 통해 매출을 크기로 통해 수익을 알아볼 수 있는 차트를 만들게

되었습니다.

 

이렇게 데이터의 관계를 텍스트가 아닌 색으로 빠르게 파악할 수 있는 열지도(heat map)이 장점입니다.

 

다음 이 시간에는 더 재미있는 그래프로 찾아 뵙겠습니다. *^^*

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

+ Recent posts