Tableau Data Management add on
Tableau Server 기반으로 작동하며 추가 라이선스 활성화 후 사용할 수 있습니다.


Tableau Data management add-on은 다음 제품을 포함합니다
Tableau prep conductor
Tableau catalog



Tableau 데이터 관리를 사용하면 분석 환경 내에서 데이터를 더 잘 관리할 수 있으므로 항상 신뢰할 수 있는 최신 데이터를 사용하여 의사 결정을 내릴 수 있습니다. 데이터 준비에서 카탈로그 작성, 검색 및 거버넌스에 이르기까지 Tableau Data Management는 데이터에 대한 신뢰를 높여 셀프 서비스 분석의 채택을 가속화합니다.

 




Tableau Data management를 선택해야 하는 이유


- 모두를 위한 신뢰
IT에서 개별 분석가에 이르기까지 Tableau Data Management는 데이터 환경에 대한 신뢰를 높이는 데 필요한 가시성과 제어 기능을 제공합니다.

- 올바른 데이터의 검색 가능성
Tableau 데이터 관리를 사용하면 모든 사람 이 분석에 올바른 데이터가 사용되고 있다고 확신할 수 있습니다.

- Tableau 플랫폼과 통합
Tableau를 위해 제작된 데이터 관리 옵션으로 데이터 및 분석 환경을 최대한 활용할 수 있습니다.

- 대규모 데이터 관리
데이터 관리를 운영하고 자동화하여 셀프 서비스 데이터 준비 및 분석을 보다 쉽게 수행할 수 있습니다.

 


 

 

Tableau Prep Conductor

자동화, 가시성, 모니터링

Prep Builder에서 사용자가 만드는 데이터 처리 흐름을 전사적으로 적용하고 운용할 수 있게 해주는 서비스로 개인 사용자가 만드는 데이터 변환을 전사 수준으로 확장시키며, 데이터 흐름 예약, 모니터링 및 관리에 유용합니다.

 

 

1. 서버에 흐름 게시 및 실행

- Tableau Prep Conductor를 사용하면 서버 환경에서 흐름을 쉽게 게시하고 실행할 수 있습니다. Tableau Server 또는 Tableau Online을 사용하여 데이터 원본을 안전하게 공유하십시오. 조직의 모든 사람이 준비된 최신 데이터로 작업할 수 있는 환경을 만듭니다.

 

2. 흐름 스케쥴링

- 낮이나 밤에 필요할 때 흐름이 실행되도록 예약하세요. 데이터 준비 프로세스를 자동화하여 항상 최신 데이터를 준비하고 분석할 수 있도록 합니다.

 

3. 서버 전체의 흐름 모니터링

- 현재 Tableau Server에서 사용할 수 있는 동일한 도구로 흐름을 모니터링하십시오. 상태 페이지, 관리자 보기 및 실행 기록을 사용하여 전체 서버의 흐름 상태를 확인하여 문제를 신속하게 해결할 수 있습니다. 사전 경고로 흐름이 정상인지 항상 확인하십시오.

 

 


 

 

Tableau Catalog

Tableau 환경의 모든 데이터에 대한 이해가 가능하며 손쉽게 데이터 계보를 확인하고 영향도 파악을 할 수 있습니다. 또한, 신뢰 가능한 데이터 확인 후 Tableau 서버에 통합하고 Metadata API를 통해 타 시스템과 연계 가능합니다.

 

 

1. 가시성, 신뢰, 검색 가능성.

Tableau Catalog는 모든 사람에게 혜택을 줍니다. Tableau Catalog는 데이터에 대한 완전한 그림과 Tableau 환경의 분석에 연결되는 방식을 제공함으로써 IT 및 비즈니스 사용자 모두의 신뢰와 검색 가능성을 높입니다. 데이터 변경 내용을 전달하거나 대시보드를 검토하거나 분석에 적합한 데이터를 검색하는 경우 Tableau Catalog를 사용하면 조직에서 항상 올바른 데이터를 사용하고 있다는 확신을 가질 수 있습니다. 더 나은 가시성은 더 나은 데이터 관리를 의미합니다

 

2. 데이터에 대한 전체 보기

Tableau Catalog Tableau 환경의 모든 데이터 자산을 하나의 중앙 목록으로 자동으로 수집합니다. 인덱스 일정을 설정하거나 연결을 구성할 필요가 없습니다. 한 곳에서 모든 테이블, 파일 및 데이터베이스를 빠르게 볼 수 있습니다.

 

3. 데이터 관계를 더 잘 이해

- 데이터베이스 마이그레이션, 필드 사용 중단 또는 테이블에 새 열 추가는 모두 환경의 자산에 잠재적인 영향을 미칩니다. 계보 및 영향 분석을 사용하면 어떤 자산이 업스트림 및 다운스트림에 영향을 미칠지 뿐만 아니라 영향을 받는 사람도 확인할 수 있어 모든 사람의 골칫거리를 최소화할 수 있습니다.

 

4. 컨텍스트의 메타데이터

- 데이터 세부 정보는 대시보드만 보고 있는 사용자도 분석 중인 데이터를 신뢰할 수 있도록 합니다. 데이터 품질 경고를 사용하여 한 곳에서 상태를 설정하고 데이터 소스에서 대시보드에 이르기까지 환경 전체의 모든 자산이 사용자에게 관련 정보를 제공하여 자신 있게 비즈니스 결정을 내릴 수 있도록 합니다.

 

5. 분석에 적합한 데이터 찾기

- 분석을 시작할 데이터를 아는 것은 어려울 수 있습니다. 데이터에 연결할 때 더 많은 메타데이터와 컨텍스트를 사용할 수 있으므로 분석에 적합한 데이터를 사용하고 있으므로 안심하십시오.

 

6. 조직 전체에서 메타데이터 활용

- 메타데이터는 조직 전체의 여러 애플리케이션에 존재합니다. Metadata REST API를 사용하여 분석이 수행되는 Tableau에서 메타데이터를 가져옵니다.

 


 

 

Tableau는 현대적인 셀프 서비스 분석을 통해 비즈니스 인텔리전스 환경을 혁신했습니다. 도메인 전문 지식을 가진 사람들이 직관적이고 시각적인 분석을 할 수 있다는 것은 사람들이 IT에 의존할 필요 없이 자신의 데이터 질문을 탐색하기 시작하고 분석을 쉽게 반복하여 새로운 통찰력을 발견할 수 있다는 것을 의미합니다. 이제 최신 분석 배포가 증가함에 따라 IT는 올바른 데이터를 선별, 관리 및 홍보해야 하는 문제에 직면하고 있으며 비즈니스 사용자는 분석을 위해 관련성이 있고 신뢰할 수 있는 데이터를 찾는 데 어려움을 겪고 있습니다.

 사람들이 데이터를 보고 이해할 수 있도록 지원하기 위해 Tableau는 고유한 방식으로 사용자를 위한 데이터 관리에 투자하고 있습니다. 분석의 맥락에서 사용자에게 도달하는 고도의 시각적 솔루션을 통해 조직의 모든 사람이 올바른 데이터를 가지고 있으며 의사 결정을 위해 신뢰할 수 있음을 알 수 있도록 돕고 있습니다. 가시성, 검색 가능성 및 신뢰를 높이면 관리되는 데이터 환경을 확장하는 데 도움이 됩니다. , IT 부서는 급증하는 데이터 소스와 분석 콘텐츠를 더 잘 관리할 수 있고 최종 사용자는 원하는 데이터를 더 빨리 찾고 분석에 자신감을 가질 수 있습니다.

 

 

 

 

 

 

 

 

 

Tableau data management add-on 을 체험하시려면 아래 링크를 클릭해주세요

https://10az.online.tableau.com/#/site/demodepot/catalog/tables

 

 

 

 

데이터 산업이 폭발적으로 관심을 받고 성장하면서, 우리는 뉴스나 텔레비전에서 종종 데이터에 관한 이야기를 듣고는 합니다. 데이터 관련 분야가 인기를 얻으면서 정보처리기사, 빅데이터 분석 기사 등 데이터에 대한 공부를 하기도 하는데요, 그렇다면 과연 전세계적으로 데이터 산업의 시장 규모는 어느 정도나 될까요?

우선 데이터 산업이란, 데이터의 생산, 수집, 처리, 분석, 유통, 활용 등을 통해 가치를 창출하는 상품과 서비스를 생산 및 제공하는 산업입니다. 우리나라의 데이터 산업 시장 규모는 얼마나 될까요?

 

 

국내 데이터 시장 규모

과학기술정보통신부와 한국데이터산업진흥원에서 2 17일 발표한 “2020년 데이터 산업 현황조사” 결과에 따르면, 국내 데이터 산업 시장규모는 2020년 약 192,736억원 규모로 연평균 증감률(CAFR) 11.3%를 기록하면서 지속적인 성장세를 이어나가고 있다고 합니다.

이런 성장세라면 데이터산업은 앞으로도 꾸준히 규모가 커질 것으로 예상되는데요, 데이터산업의 부문별 규모를 살펴보면, 2019년 기준 데이터 판매 및 제공 서비스업 시장이 82,364억 원으로 가장 높고, 다음으로 데이터 구축 및 컨설팅 서비스업이 65,412억 원, 데이터 처리 및 관리 솔루션 개발·공급업이 2805억 원 정도라고 합니다.

그렇다면 산업별로 성장률은 얼마나 될까요? 데이터 산업 부문별 증감률을 보면, 데이터 처리 및 관리 솔루션 개발·공급업 시장이 2018년 대비 11.8%로 가장 높게 나타났고, 2018년부터 2020년 예상까지의 연평균 증 감률(CAGR) 15.0%로 나타나, 전체 데이터 산업 시장의 연평균 증가율 11.3%보다 높은 성장세를 보였습니다. 한편, 데이터 판매 및 제공 서비스업은 8.7%, 데이터 구축 및 컨설팅 서비스업은 6.7%의 성장률을 보이며 데이터 산업별로 모두 폭 넓은 성장세를 모여주고 있습니다.

2010~2020년(E) 데이터 산업 시장규모 (출처 : KDATA, 2020년 데이터산업현황조사)

이렇듯 향후 데이터 산업 시장은 지난 3개년 연평균 성장률인 11.3%와 같이 지속적으로 성장한다면 2026(P)까지는 36조 원을 넘어설 것으로 전망됩니다.  

2020(E)~2026(P) 데이터산업 시장 전망 (출처 : KDATA, 2020년 데이터산업현황조사)
2020(E)~2026(P) 데이터산업 시장 전망 (출처 : KDATA, 2020년 데이터산업현황조사)

 

 

글로벌 데이터 시장 규모

이번에는 우리나라가 아닌 세계 데이터 시장 규모를 알아보겠습니다. OnAudience.com글로벌 데이터 시장 규모 2017-2019” 보고서에 따르면 세계 데이터 시장은 2017189억 달러에서 2021523억 달러로 두 배 이상 성장할 전망이라는 데요, 빅데이터 시장 역시 빠르게 성장하여 코로나 위기에 직면했던 2020년에는 705억 달러의 규모로 성장한 것으로 추산됩니다.

2017-2021 글로벌 데이터 시장 성장 (출처 : OnAudience, Global data, programmatic and display ad market 2017-2021)

글로벌 빅데이터 시장은 분석 기간인 2020년부터 2027동안 19.4%의 연평균 성장률(CAGR)을 기록할 것으로 추정되며, 2027년까지 2,434억 달러 규모까지 도달할 것으로 예상됩니다.

 

이번에는 몇가지 나라의 데이터 시장 동향에 대해 살펴볼까요?

미국 : 미국의 빅 데이터 시장은 2020년 약 210억 달러 규모로 추산됩니다.

중국 : 세계 2위 경제 대국인 중국은 연평균 성장률(CAGR) 18.8%의 뒤를 이어 2027년까지 미화 424억 달러의 시장 규모에 도달할 것으로 예상됩니다.

일본 & 캐나다 :  다른 주목할만한 지리적 시장 중 일본과 캐나다는 2020-2027년 기간 동안 각각 17.2%16.3% 성장할 것으로 예측됩니다.

독일 : 유럽 내에서 독일은 약 13.4%의 연평균 성장률을 기록할 것으로 예상됩니다.

 

 

 

코로나로 인한 팬데믹 상황에서도 글로벌 데이터 산업 규모는 큰 폭으로 성장했으며, 앞으로도 이런 성장세를 이어 데이터 시장은 확장될 것으로 보입니다. 따라서 나날히 커져가는 데이터 산업의 성장률에 발맞춰 빅데이터 시대를 맞이하는 자세를 가져야 합니다.

 

 

 

 

 

 

 

 

 

 

 

Hankooktire Success Story !

디포커스의 고객사 한국타이어에서 태블로를 도입한 디포커스와 협업하여 우수한 업무 성과를 이룬 사례에 대한 내용입니다.

 

한국 타이어는 국내 타이어 시장 1 기업으로, 승용차, 전기차, SUV 다양한 종류의 차량에 장착되는 타이어를 제조합니다. 뿐만 아니라 2020 유럽의 유명 자동차 전문지가 실시한 타이어 테스트에서 1 위를 차지할만큼 세계적으로 최고 수준의 기술을 인정 받고 있습니다. 최근에는 4 산업 혁명 시대로의 전환에 맞추어 인공 지능 (AI) 러닝 기술을 접목 주행 도로 위험 탐지 솔루션, 타이어 컴파운드의 물성 예측 모델 개발에 성공하면서 업계의 디지털 전환을 선도하고 있습니다. 아시아와 미국, 유럽의 8 생산 기지에서 타이어를 생산하여 전세계 180 단위로 판매하고 매출액은 2019 기준으로 6.8 조에 달합니다. 전세계에서 2만여명의 직원이 일하고 있습니다. 한국 타이어는 디지털 전환, 데이터 문화 구축, 데이터 기반의 의사 결정, 비즈니스 부서 현업 직원의 셀프 서비스 분석 스마트 팩토리 프로젝트를 위해 태블로를 사용합니다. 태블로를 통해 방대한 양의 데이터에서 유의미한 인사이트를 가장 빠른 속도로 발견하고 공유하면서 업무 효율성을 높이고 외부 환경 변화에 맞서서 비즈니스 성장을 주도하고 있습니다. 특히 태블로로 전세계 8 생산 공장의 데이터를 연동한 통합 데이터 거버넌스 체계를 구축하며, 스마트팩토리 고도화에 필요한 빅데이터 분석 프로그램을 개발하는 중입니다.

전사적인 데이터 문화 구축을 통해 75% 보고 업무 시간 단축

현재 한국타이어는 태블로를 통해 경영, 재무, 판매, 제품, 제조, 생산 관리 연구하고, 전사 공유된 대시보드를 기반으로 논의하여 실시간 의사결정을 내립니다. 전사적인 데이터웨어하우스(DW) 태블로를 연결해 분석에 필요한 8~9TB(테라 바이트) 규모의 데이터세트를 구축하고 데이터를 표준화함으로써 부서간 협업, 성과측정 등의 업무를 개선하고 있습니다. 또한 최대 30 만줄의 데이터를 빠르게 처리하고 있습니다. 과거엔 현업에서 데이터 분석 보고서 개발에 대한 아이디어를 IT부서로 전달하면, IT부서에서 적합한 데이터 세트를 구축한 리포트 개발, 현업과의 협업을 통한 수정 고도화, 실제 사용에 이르기까지 많은 시간이 걸렸습니다. 뿐만 아니라 데이터 표준화가 되어 있지 않아 서로 다른 업무들에 일관되게 적용 가능한 분석 보고 시스템을 구축하기 어려웠습니다. 한편, 한국타이어는 전세계 규모로 운영되는 비즈니스에 핵심적인 시스템의 데이터를 활용해 리포트를 개발하고 비즈니스 성과 향상으로 이어질 있는 인사이트를 도출하고자 하는 현업 직원의 수요가 증가하고 있습니다. 이에 경영진은 전사적인 분석 시스템 기반의 데이터 문화를 구축하고, 현업 직원의 데이터 활용 역량 향상을 적극 장려하길 원했습니다. 태블로는 드래그앤드롭 기반의 직관적인 시각화 작업을 통해 모든 비즈니스 부서 직원이 초기에 IT기술 교육 지원만으로 빠른 시간 안에 정교한 리포트 개발이 가능하다는 때문에 도입했습니다. 또한, IT담당자가 현업의 요구사항에 즉시 대응이 가능하다는 점도 장점이라고 판단했습니다. 태블로 도입 한국타이어는 부서의 현업 직원이 표준화된 데이터를 분석할 있는 '셀프서비스 분석' 환경을 구축했습니다. 다양한 종류의 데이터를 표준화하면서, 사내 상이한 조직 간의 원활한 데이터 기반 협업을 위한 일관된 기준을 수립했습니다. 태블로를 통해 서로 다른 부서의 현업 직원은 데이터에 대한 공통된 이해를 바탕으로 업무에 맞춰 데이터를 범용적으로 활용합니다. 현업 부서의 직원들은 사용 편의성이 뛰어난 태블로를 통해 리포트 개발에 활용할 있는 데이터를 자유롭게 탐색하고, 요구사항을 체계적으로 구체화시키고 있습니다. 이에 IT부서는 고난이도의 리포트 개발 데이터 관리만을 담당하여 업무의 디지털화 측면에서 보다 전사적인 전략업무에 집중하고 있습니다.

태블로 GUI 환경의 손쉬운 데이터 처리 기능 덕분에, 한국타이어는 1개의 리포트를 개발하는 걸리는 시간을 달에서 주로 75%만큼 단축시켰습니다. 현업 직원은 태블로 포털에 공유된 대시보드, 그리고 전사의 7 비즈니스 시스템에 내장된 태블로 대시보드를 통해 방대한 양의 데이터를 생각의 속도만큼 빠른 시간 안에 시각화합니다. 한국타이어 정보전략실 G.IT기획팀 이재상 책임은태블로는 제조를 포함한 다양한 산업 분야와 대학에서 대중화 만큼 뛰어난 사용편의성을 자랑합니다. 특히, 워드 클라우드 또는 히트맵과 같이 국내 기업에서 사용하지 않는 형태의 대시보드도 쉽게 개발할 수있어 분석과 인사이트 기반으로 업무 프로세스를 향상시키도록 지원합니다.”라고 전했습니다. 현재 한국타이어의 경영진은 전세계 비즈니스의 환경 변화에 대응해 중요한 의사결정을 실시간으로 내려야 하는데, 태블로 기반으로 연결된 환경은 경영진이 언제 어디서든 핵심 비즈니스 성과 지표를 바탕으로 현업과 논의하고 의사결정을 내리도록 합니다. 한국타이어 정보전략실 G.IT 기획팀 이재상 책임은모던BI 개척한 것으로 평가받으며 실제로 국내 유수의 레퍼런스를 보유한 태블로와 파트너십을 통해 전사 조직에 걸쳐 데이터 기반의 업무 지원을 강화하고 있습니다. 앞으로도 표준화된 데이터 기반의 협업과 의사결정을 통해 제조업계의 디지털 전환을 선도할 것입니다.”라고 말했습니다.

스마트 팩토리 프로젝트를 통해 제조업 디지털 전환 선도

현재 제조업 분야에서는 제조업 밸류 체인과 업무 환경을 디지털화하고 5G, AI, IoT, 로봇 등의 첨단기술을 결합 운영 효율성, 생산성 제품 품질을 높이고 안전을 강화하고 있습니다. 한국타이어는 재료 수급, 디자인, 연구개발, 생산 유통 그동안의 타이어 제조업 운영을 통해 쌓아온 데이터를 바탕으로 스마트 팩토리 기술을 고도화하는 프로젝트를 추진 중입니다. 프로젝트를 담당하는 한국타이어 연구소와 생산 본부는 한국타이어의 각종 공장 설비에서 단위로 발생하는 방대한 데이터를 태블로를 통해 빠르게 시각화하고 있습니다. 태블로 대시보드를 통해 향후 설비 유지보수 관리, 개발 스마트팩토리 애플리케이션에 필요한 데이터만을 따로 분류하고, 차트 로직을 통해 해당 데이터를 분석하며, 이를 바탕으로 데이터 기반의 의사결정 문화를 만들어가는 것을 목표로하고 있습니다. 특히 한국 타이어 연구소는 아마존 환경에서의 타이어 컴파운드 분석 결과를 태블로로 시각화함으로써 AI 기술을 타이어 컴파운드 물성 예측 모델에 결합하도록 도왔습니다. 여기서 나아가 한국타이어는 본사의 혁신 이니셔티브와 데이터 표준화 체계를 전세계 오피스로 확장할 있도록, 글로벌 오피스와 공장의 데이터를 빠르게 취합하여 제공할 있는 시스템 환경을 구축하고 데이터의 연계를 강화할 계획입니다. 한국타이어 정보 전략실 G.IT 기획팀 이광원 사원은현재 제조 산업에서는 IoT AI 기반의 스마트 팩토리 구축이 화두입니다. 태블로를 활용한 데이터 분석은 스마트 팩토리에서 발생한 수많은 종류의 데이터를 통합하여 제조 공정의 안정성과 효율성을 향상시키는 필요한 인사이트를 발견하도록 지원하므로 디지털 시대의 선도적인 경쟁력을 갖추는 핵심적입니다."라고 강조했습니다.

비즈니스 부서가 외부의 상황 변화에 민첩하게 대응할 있도록 지원

태블로 도입 이전, 한국타이어에는 시스템의 데이터 사일로 현상으로 인하여 비즈니스 의사결정 성과 평가에 활용되는 데이터의 투명성이 낮았습니다. 실제로 데이터 조회, 정리 보고의 과정에서 현업 담당자의 주관 으로 인해 데이터가 변형되는 일이 잦았기 때문에, 경영진 단에서 데이터 표준화와 분석 체계화에 대한 요구가 급증해 왔습니다.
신뢰도 낮은 데이터는 민첩한 의사결정 변화 대응에 장애물로 작용했습니다. 한국타이어는 빠르게 변화하는 비즈니스 환경 변화에 대응하여 보다 정확한 데이터와 분석 결과를 기반으로 업무를 진행할 있도록 태블로의 리포트 공유 포털에서 실시간으로 비즈니스 정보를 공유합니다. 해당 포털에서 현업 직원은 태블로 지도 또는 그래프로 시각화된 전세계 지역별 한국타이어 제품 수요 현황 데이터를 확인합니다. 과거에는 전세계 한국타이어의 재고 판매 현황 데이터를 업데이트하는 8시간이나 걸려 위기 상황에 상황에 대처하기 어려웠지만, 태블로 도입 후에는 30 단위로 해당 데이터를 판매, 물류 영업 담당 직원에게 제공하고 있습니다한국타이어의 정보 전략실 G.IT 기획팀 이재상 책임은지금과 같이 급변하는 시대에 비즈니스를 안정적으로 운영하기 위해 비용 절감 최적화를 추구해야 합니다라며, “태블로를 통해 전세계 영업장의 판매 실적 재고 데이터를 현업 직원과 거의 실시간으로 공유하여 판매 측면에서 사용 가능한 재고의 범위를 넓혀 지원하였으며, 비즈니스의 회복탄력성을 향상시킬 있었습니다라고 설명했습니다.

 

경영 재무 관리 부문에서는 태블로 대시보드를 도입하여 보고 업무 시간을 대폭 단축했으며, 전사에서 가장 빠르게 모든 엑셀 리포트를 태블로로 전환할 예정입니다. 특히 업무에 태블로가 많은 비중을 차지하는 재무 관리 부문에서는 태블로로 구축한 대규모 데이터 세트를 바탕으로 외부 IT 전문가의 리소스 없이 자체적으로 리포트를 개발하고 있습니다.또한 비용 관리 부문은 메일 구독 기능을 통해 부문, 팀별 예산 사용 현황을 보여주는 직관적인 대시보드를 공유합니다.한국타이어의 정보전략실 G.IT기획팀 이재상 책임은태블로는 실시간 데이터 리포트 공유, 민첩한 리포트 개발기능을 통해 급변하는 상황 속에서도 비즈니스 기회를 쉽게 모색할 있도록 합니다. '디지털 전환' 시대를 선도하기 위한 다양한 노력을 전개하는 한국타이어는 앞으로도 태블로 셀프-서비스 BI 분석을 활용하여 전세계 시장의 프리미엄 브랜드로서의 선도적인 포지셔닝을 유지할 있으리라 예상합니다.”라고 말했습니다. 한편, 한국타이어의 태블로 도입 서비스 구현 과정에 파트너사 디포커스가 많은 기여를 했습니다. 디포커스는 BI 구축 영역에서 폭넓은 경험을 지닌 회사로 한국타이어 내부의 다양한 요구사항을 태블로로 구현할 있도록 지원했습니다. 태블로 도입 초기, 디포커스는 주로 태블로 대시보드 개발과 직원 교육을 진행했으나, 점차 데이터 개발, 시각화 디자인 컨설팅까지 지원을 확대하여 프로젝트 참가자와 산출물에 대한 만족도 향상에 중요한 역할을 했습니다. 나아가, 태블로 구축 프로젝트 과정에서 BI 아니라 정보계를 아우르는 다양한 레퍼런스 방법론을 바탕으로 태블로 활용을 위한 최적의 방식을 찾을 있도록 했습니다.

 

<<본 기사 내용은 태블로 공식 홈페이지(tableau.com )에서 발췌하였습니다.>>

https://www.tableau.com/ko-kr/solutions/customer/hankook-leads-digital-transformation-business-efficiency-with-tableau

"태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(https://www.dataqrator.com)가 도와드립니다."

안녕하세요 여러분~^^ 디포커스 태블로 둥이입니다!

태블로 차트를 알아보는 여섯 번째 시간입니다.

오늘은 'TabPy 분석 확장 프로그램'을 알아보겠습니다.

1.Python 설치

하기의 링크로 접속하여 Linux Mac 또는 Windows용 최신 버전의 Python을 다운로드하여 설치합니다

Download Python | Python.org

Python Script를 사용하는 이유?

Python은 범용 프로그래밍에 널리 사용되는 고급 프로그래밍 언어입니다. Python 명령을 분석 확장 프로그램에 전송하는 방식으로, 고객 변동 예측이나 정서 분석 실행과 같은 작업을 수행할 수 있습니다.

2.TabPy 설치

Tableau Python 서버 = TabPy

하기의 링크로 접속하여 TabPy를 다운로드하여 설치합니다.

GitHub - tableau/TabPy: Execute Python code on the fly and display results in Tableau visualizations:

우측의 Code 버튼을 클릭해 Download Zip을 눌러 설치를 진행합니다

다운로드 된 Zip 파일을 압축을 풀어 저장합니다.

3.Anaconda 설치

하기의 링크로 접속하여 Anaconda를 설치합니다.

Anaconda | Individual Edition

설치 후 프로그램의 Anaconda Prompt를 관리자 권한으로 실행합니다.

4.Python pip 명령어를 이용한 패키지 설치

Prompt에 pip 명령어를 사용하셔서 해당 명령어에 대한 옵션을 확인 후

python -m pip install --upgrade pip를 입력하여 패키지 매니저를 최신버전으로 업그레이드합니다.

pip install tabpy 명령어를 사용해 tabPy설치를 진행합니다.

이후 pip install sklearn 명령어로 scikit_learn 패키지를 설치합니다.

설치 완료 후 ​tabpy 명령어를 사용해 해당 패키지가 이용하는 port등의 상세내역을 확인할 수 있습니다.

* pip : Package Manager로 Python에서 작성된 패키지 소프트웨어 설치 시 사용

** port 9904 : TabPy 기본 port 번호

*** pip install sklearn : 머신러닝을 위한 scikit_learn 패키지 설치

5.분석 확장 프로그램 구성

Tableau에서는 SCRIPT 함수 집합을 통해 분석 확장 프로그램에 연결할 수 있습니다.

SCRIPT 함수를 외부 서비스에 전달하기 전에 서비스에 대한 연결을 구성해야 합니다.

Tableau Desktop에서 상단의 도움말 > 설정 및 성능 > Analytics 확장 프로그램 연결관리를 선택합니다.

연결하려는 외부 서비스를 선택 (TabPy) 합니다.

도메인 또는 IP 주소를 사용하여 서버 이름을 입력하거나 선택합니다.

드롭다운 목록에 가장 최근에 연결된 서버 및 localhost가 포함되며 초기 설정 시 변경하지 않았다면 localhost 9004를 입력합니다.

이후 연결 테스트를 클릭하여 진행 후 저장하면 tableau python script를 사용할 수 있습니다.

* 서버가 SSL 암호화를 사용하는 경우 SSL 필요 옵션을 선택합니다.

Tableau Server는 운영 체제 키 저장소에 설치되어 있는 인증서를 읽고 보안 연결을 설정합니다.

6.Tabpy 활용 데이터 셋 설명

다음으로는 GermanCreditData.csv 를 사용하여 tabpy를 통해 고객의 대출 상환 여부 예측치를 나타내는 시각화를 진행해보겠습니다.

해당 데이터 셋은 대출을 요청한 은행 고객의 다양한 특징(예: 나이, 고용 상태, 개인 상태, 성별 등), 대출 상환 여부 등으로 구성되어 있습니다.

해당 데이터셋을 통해 시각화를 진행하기 위해 predictions.csv 파일을 이용합니다.

해당 데이터 셋은 GermanCreditData.csv을 학습시켜 어떤 고객들이 대출 상환을 기한 내에 할 수 있는지 여부를 시각화로 표현하게 됩니다.

머신 러닝 알고리즘의 경우 파이썬의 scikit-learn 라이브러리에서 찾을 수 있는 의사 결정 트리 분류를 사용할 것입니다.

추가적인 라이브러리는 링크를 참조하시어 사용하시길 바랍니다.

7.Tabpy 활용

새 워크북을 열어 Analytics 확장 프로그램 연결 관리의 TabPY와 연결해 줍니다.

Predictions.csv 파일을 tableau와 연결해 줍니다.

계산된 필드를 named Prediction 을 이름으로 하여 스크립트를 작성합니다.

※결정트리 알고리즘 스크립트 설명

*데이터의 기준을 세워 이를 사용하여 규칙을 작성해 효율적인 분류를 하는 알고리즘

SCRIPT_INT(" 스크립트의 결과를 정수로 반환

import numpy as np numpy 라이브러리 import

import pandas as pd pandas 라이브러리 import

from sklearn.tree import DecisionTreeClassifier sklearn.tree 라이브러리의 결정 트리 실습 모듈 import

data=pd.read_csv(r'C:\Users\SAMSUNG\Desktop\tabpy\GermanCreditData.csv') 학습시킬 .csv 파일 불러오기

X=data.drop(['ID','Class'],axis=1) X에 해당 csv.의 ID와 Class 칼럼을 제외한 나머지를 할당

y=data['Class'] Y에 해당 csv.의 Class 칼럼만을 할당

clf = DecisionTreeClassifier(random_state=2) 결정트리 알고리즘을 생성하고 학습의 결과과 변경되지 않도록 number 지정

clf.fit(X,y) 결정트리 알고리즘 학습

X_pred=np.transpose(np.array([_arg1,_arg2,_arg3,_arg4,_arg5,_arg6,

_arg7,_arg8,_arg9,_arg10,_arg11,_arg12,_arg13, _arg14, _arg15,

_arg16, _arg17, _arg18, _arg19, _arg20])) 컬럼 값들 (답을 얻고 싶은 데이터들)을 numpy 행렬로 변환해 X_pred에 할당

 

pred = clf.predict(X_pred) X_pred 의 데이터들을 학습하여 예측한 결과를 pred에 할당

return pred.tolist( ) pred에 할당된 행렬을 list로 변환해 결과로 도출

",

SUM([Status of account]),SUM([Duration(months)]),SUM([Credit History]),

SUM([Purpose]),SUM([Credit amount]), SUM([Savings account/bonds]),

SUM([Employment]), SUM([Installment rate]), SUM([Personal status/sex]),

SUM([Debtors/Guarantors]), SUM([Residence since]), SUM([Property]),

SUM([Age]), SUM([Other installment plans]), SUM([Housing]),

SUM([Existing credits at bank]), SUM([Job]),

SUM([People liable to provide maintenance for]),

SUM([Telephone]), SUM([Foreign worker])) csv.의 칼럼 값들을 계산해 위의 배열에 할당

과는 다음과 같이 1 좋음, 2 나쁨 2가지로 나누어집니다.

고객별로 대출 상환여부를 보기 위해 Customer Id와 Customer Name을 행에 올리고 만든 계산된 필드를 마크의 모양에 올립니다.

해당 마크의 모양을 1은 초록색 체크 모양으로 2는 빨간 엑스 모양으로 편집하여 다음과 같은 화면을 만듭니다.

위의 화면처럼 체크 표시된 고객들은 대출 상환을 할 수 있는 고객으로 차후 대출 시 대출 허가 승인이 되는 고객들이며, 엑스표인 고객들은 대출 상환을 제때 할 수 없어 대출시 승인이 나지 않거나 주의해야 될 고객임을 알 수 있습니다.

지금까지 TABLEAU에서 확장기능을 통해 PYTHON을 이용한 딥러닝 사례에 대해 살펴보았습니다~!

그럼 다음 시간에 만나요!

"태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(https://www.dataqrator.com)가 도와드립니다."

 

"태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(https://www.dataqrator.com)가 도와드립니다."

안녕하세요^^ 디포커스 태블로 둥이입니다~!!

태블로 차트를 알아보는 다섯 번째 시간입니다.

오늘은 '블렌딩&와플차트'를 알아보겠습니다~!

블렌딩은 태블로에만 있는 데이터를 가공하는 방법이라고 이해하시면 됩니다.

기본적인 데이터 형태 가공은 ‘Join’ 형태가 있는데,

이 경우에는 데이터에서 이미 가공을 하고 데이터를 갖고 오게 됩니다.

▶JOIN(데이터 편집)

블렌딩은 각각의 데이터를 갖고 와서 주 데이터 기준으로 공통의 데이터를 집계하는 형태를 말합니다.

▶블렌딩 (워크시트 화면)

각각의 데이터를 갖고 와서 주 테이블의 특정필드(지역)에 집계의 단위를 맞추고 결합시키는 것입니다.

블렌딩은 물리적으로 데이터를 붙이지 않고, 하나의 화면에 두 테이블이 붙어 있는 듯하게 보여지는 것입니다.

본 실습에 데이터는 Tableau에서 기본적으로 제공하는 Sample 슈퍼스토어 - 주문 시트와플 차트를 만들기 위해서 가공된 데이터 SET를 갖고 와서 만들도록 하겠습니다.

*Tableau Desktop 버전에 따라 슈퍼스토어에 데이터 값이 상이할 수 있습니다.

Waffle dataset은 1%를 칸으로 표현하기 때문에 각 항목을 5줄로 표현하고 칸을 100개를 만든 데이터가 필요합니다.

Sample 슈퍼스토어에 주문 시트 추가 후 위에서 만든 가공된 Data Set도 갖고 와줍니다.

블랜딩을 이용하여 와플차트를 만들기 위해 데이터에 혼합관계 편집(블랜딩)을 해줍니다.

*Tableau 버전마다 Blending을 의미하는 한글 표현은 상이할 수 있음, 편집 위치는 동일함.

혼합 관계 편집을 이용하여 슈퍼스토어 Data와 가공한 와플 차트 Data 의 대분류로 맵핑 시켜줍니다.

대분류 별 수익율을 와플 차트로 만들기 위해 수익율 계산식을 만들어 줍니다.

상단의 데이터에서 슈퍼스토어-샘플 클릭 후 계산식을 이미지와 같이 작성 후 확인을 누릅니다.

수익율 계산식을 만든 후 데이터에 SHEET1을 클릭하여 수익률이 Percentage보다 큰 부분만 표시할 수 있도록 계산식을 만들어둡니다.

혼합 관계 편집을 이용하여 슈퍼스토어 Data와 가공한 와플 차트 Data 의 대분류로 맵핑 시켜줍니다.

측정값 집계가 되어있는 것을 선택 해제 하게 되면, 칸으로 쪼개지면서 각 항목에 맞게 막대처럼 생기게 됩니다.

대분류의 색상 마크를 넣게 되면 대분류 별로 색상이 달라지는 것이 보이게 됩니다.

위에 만들었던 값 범위에 대한 항목을 색상에 넣게 되면 ‘참,거짓’으로 값이 나뉘게 되고 거짓인 부분은 하얀색으로 표시가 되지 않도록 만들어줍니다.

위에 색상에 값을 넣은 것을 확인하게 되면 아래와 같이 각각 자기의 %만 표시가 되는 것을 확인할 수 있습니다.

차트 위에 항목 이름과 수익률(%)를 표시하기 위해서 레이블에 넣고 표시하면 되는데, 자동으로 하게 되면 모든 항목에 값이 표시되므로 값 표시 계산식을 만들고 필드에서 값 표시를 선택해주시면 됩니다.

그럼 아래와 항목과 수익률%가 하나만 값이 표시 되는 것을 볼 수 있습니다.

마크의 크기를 중간 사이즈로 하게 되면 공간이 있던 부분이 꽉 채워져서 표현되게 됩니다.

마크의 색상에서 테두리 색상을 선택하게 되면 칸 별로 나눠서 표현되게 됩니다.

오늘은 순서대로 와플 차트를 만드는 방법을 소개해봤습니다.

그럼 다음 시간에 만나요~!

"태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(https://www.dataqrator.com)가 도와드립니다."

 

"태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(https://www.dataqrator.com)가 도와드립니다."

안녕하세요! 디포커스 태블로 둥이입니다~~! ^^

태블로 차트를 알아보는 네 번째 시간입니다.

이번엔 태블로에 '사용자 지정색상'을 만들어 보겠습니다.

자주 사용하는 색상이나 기업을 상징하는 색상을 미리 등록하여 편하게 사용할 수 있습니다.

먼저 “C:\Users\USER\Documents\내 Tableau 리포지토리”

위의 경로에 “Preferences.tps" 파일을 메모장과 같은 편집프로그램을 이용하여 실행시켜 주세요.

“Preferences.tps“ 파일을 처음 열어 보신다면 아래처럼 텍스트가 되어있을 거에요.

저희는 이 파일에 나만의 색상으로 수정해보겠습니다.

작성에 앞서 3가지 유형의 사용자 지정 색상표를 만들 수 있습니다.

1. 범주형 색상표 (regular)

2. 단일 색상표 (ordered-sequential)

3. 다중 색상표 (ordered-diverging)

1.범주형 색상표

2.단일 색상표

3.다중 색상표

범주형 색상표는 차원과같은 불연속 필드에 자주 쓰이고

단일, 다중 색상표는 연속형 측정값을 그라데이션으로 색상 표현에 자주 쓰입니다.

이어서 모양을 등록하는방법을 알려드리도록 하겠습니다.

마크에 모양차트를 선택하면 모양표 선택을 하실 수 있습니다.

아래의 이미지를 보시면 “화살표”라는 모양표 안에 다양한 화살표 들이 담겨있는 것을 알 수 있는데 “화살표”라는 폴더에 다양한 이미지 파일들이 들어있다 라고 생각하시면 될 것 같습니다.

이러한 모양표를 만들기 위해서 준비해야 할 것은 이미지인데요..

https://newsis.com/view/?id=NISX20210302_0001355432

저는 위의 기사를 보고 1월의 스마트폰 시장점유율을 시각화 해봐야겠다고 생각하여

삼성전자, 애플, 샤오미, 오포 기업의 로고를 다운로드 받았습니다.

저장 위치는 “C:\Users\USER\Documents\내 Tableau 리포지토리\모양”에 들어가서

Logo라는 폴더를 만들어 이미지를 저장하였습니다.

저장이 되었다면 태블로로 돌아와서

모양을 보시면 Logo라고 생겼으며 제가 저장한 이미지들이 나타납니다.

만약 없다고 한다면 “모양 다시 로드” 버튼을 눌러주시면 나타납니다.

이상으로 사용자 색상과 모양표를 만들어 보았으며 앞으로 자주 쓰이는 색상과 분석에 많이 쓰이는 이미지를 사용하여 가시성있는 대시보드를 구현하는것도 좋은 방법이라 생각됩니다.

다음에 또 만나요~!

"태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(https://www.dataqrator.com)가 도와드립니다."

 

"태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(https://www.dataqrator.com)가 도와드립니다."

 

안녕하세요! 디포커스 태블로 둥이입니다~~! ^^

 

태블로 차트를 알아보는 세 번째 시간입니다.

오늘은 라인 매트릭스를 알아보겠습니다~!

라인매트릭스는 매개변수 및 인덱스를 이용하여 행, 열 개수에 맞게 그래프를 만들 수 있는 것을 말합니다.

Tableau에서 만들어지는 막대 차트는 행 이나 열을 선택하여 하나의 기준으로만 나타내는 것을 기본으로 합니다.

하지만 이러한 차트는 단순하며 차원이 많을 시 복잡하게 보이는 단점이 있습니다.

이러한 경우 라인매트릭스를 이용한 차트 구성은 디자인적으로 세련된 느낌을 줄 수 있습니다!

▶라인매트릭스 작동 설명1)가로 라는 매개변수를 활용하여 선택한 값을 기준으로 가로에 차원 수를 나타냅니다. (총 17개에 [Sub-category]를 기준으로 3칸을 선택 시 3*6 형태로 그래프를 나타냅니다.) 2) 또한 왼쪽부터 [Sub-Category], [Sales], [Profit]를 나타냅니다.

본 실습에 데이터는 Tableau에서 기본적으로 제공하는 Sample 슈퍼스토어 - Orders 시트를 이용합니다.

*Tableau Desktop 버전에 따라 슈퍼스토어에 데이터 값이 상의할 수 있습니다.

1. 칸 수를 지정할 수 있는 매개변수를 만들어 줍니다.

1) 역삼각형을 클릭하여 ‘매개 변수 만들기’ 를 선택하여 줍니다.

2) 매개변수 만들기 창에서 아래와 같이 지정하여 만들어 줍니다.

2. 행과 열에 기준이 되는 계산식을 만들어 줍니다.

1) 역삼각형을 클릭하여 ‘매개 변수 만들기’ 를 선택하여 줍니다.

2)아래와 같이 [행번호], [열번호] 라는 이름으로 계산식을 만들어 줍니다.

* 계산식이 이해 안되도 우선 만들어 주세요.

3. 계산식으로 만든 [행번호], [열번호] 및 [Sales], [Profit]을 아래와 같이 올려주세요.

1)측정값 (연두색) 으로 되어 있는 필드를 오른쪽 클릭하여 불연속형 (파랑색) 으로 변환하여 줍니다.

2)이후 기준이 되는 [Sales], [Profit]을 측정값 그룹 형태로 지정하여 올려주세요.

* [열번호], [행번호] 동일하게 지정

 

4. [Sub-Category]를 텍스트로 올리기 위해 [레코드 수]를 같이 올려줍니다.

1)[레코드 수]를 올려준 다음 default로 지정되는 합계를 최대값으로 변경하여 줍니다.

2)이후 측정값과 최대(레코드 수)를 이중축으로 지정하여 줍니다.

5. 마크에 그룹이 되는 측정값 및 최대(레코드 수) 쪽을 설정하여 줍니다.

1) 마크에 측정값 기준에서 세부정보에 [Sub-Category] 추가

2) 최대(레코드 수) 쪽에 텍스트에 [Sub-Category] 추가

* Sub-category에 텍스트가 겹쳐집니다.

6. [행번호], [열번호]에 테이블 계산 편집을 해줍니다.

1)올라가 있는 [열번호] 오른쪽 클릭 후 테이블 계산 편집에서 아래와 같이 적용

2)[행번호]도 [열번호]와 동일한 기준으로 적용시켜 줍니다.

* 설정 후 바로 적용되는 걸 확인 가능

7. 설정 후 아래와 같이 라인매트릭스가 만들어지며 [기준] 매개변수를 활용하여 조절이 가능합니다.

* 4칸 설정 시 4*5 로 변경

 

8. 완성 후 다시 돌아와 [행번호], [열번호] 계산식을 확인해보면 원리는 아래와 같습니다.

Index는 테이블 계산 에서 지정한 기준에 따라 달리 지는데 특정 차원에 [Sub-Categoey]를 기준으로 하였으므로 Index는 [Sub-Category]에 총 개수인 17로 인식됩니다.

*[기준] 값을 4로 설정 시 4*5 개로 라인매트릭스가 형성 됩니다.

*Index가 17이므로 (17-1) % 4 가 되므로 [열번호] 에 리스트는 0, 1, 2, 3 인 4개가 됩니다.

*Index가 17이므로 (17-1) / 4 의 정수 값이므로 [행번호] 에 리스트는 0, 1, 2, 3, 4인 5개가 됩니다.

오늘은 Tableau 차트 중 '라인매트릭스'에 대해 알아보았습니다.

기본적으로 제공하지 않는 차트라 만드시는데 어려우실수도 있는데요~

특히 index라는 개념은 라인매트릭스 외에도 다방면으로 사용하는 함수라 알아두시면 작업하는데 있어 큰 도움이 되시리라 생각됩니다.

그 외에도 다양한 함수 사용법은 아래 왼쪽처럼 검색이 가능하니 직접 찾아보고 실습해보시면 좋을 거 같습니다~

그럼 다음시간에 만나요~

"태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(https://www.dataqrator.com)가 도와드립니다."

 

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요 , 디포커스 태블로 둥이입니다.

오늘은 'Fixed: 정확한 세부 수준 지정하기'에 대하여 설명 드리겠습니다.

LOD 표현식을 사용하면 비쥬얼라이제이션 LOD와 완전하게 독립적으로 집계 수준을 만들 수 있습니다.

이전에는 맞춤 SQL을 통해서만 이러한 작업을 수행할 수 있었습니다.

YELP 데이터를 분석하여 비즈니스의 첫 리뷰가 작성된 연도별 집단을 찾으려 한다고 가정해 보겠습니다.

각 집단의 리뷰 트렌드가 동일합니까?

LOD 표현식을 사용하면 정확한 세부 수준에서 집단을 지정할 수 있습니다.

 

{FIXED [Business - Id] : MIN(YEAR([Review Date]))}

LOD 표현식은 Business ID별로 세부 수준을 고정합니다.

그런 다음 Business ID별 모든 리뷰에서 Review Date(리뷰 날짜)의 최소 Year(연도)를 찾고

해당 값을 Business ID와 연결합니다. First Review Year(첫 리뷰 연도)를 데이터베이스의 새 열로 간주할 수 있습니다.

 

비주얼라이제이션에서 이 필드를 사용할 때 계산 범위가 표현식에 암시적으로 정의됩니다.

아래에 표시된 것과 같이 각 Business ID(비즈니스 ID)First Review Year(첫 리뷰 연도)가 기록되면

집단을 탐색하여 정보를 얻을 수 있습니다.

 

 

 

 

FIXED 키워드를 사용하면 계산의 집계 수준을 구체적으로 정의할 수 있습니다.

INCLUDE EXCLUDE와 달리 비주얼라이제이션에서 사용되는 차원과 독립적으로 수행됩니다.

FIXED 표현식의 결과는 FIXED 차원과 비주얼라이제이션 LOD의 관계에 따라 비주얼라이제이션 LOD보다

광범위하거나 세부적일 수 있습니다.

 

 

First Review Year(첫 리뷰 연도)를 필터로 사용해 보겠습니다.

 

각 연도별 집단에는 차원형구간차원이 지정되었습니다.

, First Review Year (첫 리뷰 연도)가 뷰에서 차원으로 사용되습니다.

FIXED 표현식은 차원 또는 측정값으로 사용할 수 있습니다.

Tableau는 데이터 유형에 따라 계산 결과를 차원 또는 측정값으로 지정합니다.

INCLUDE/EXCLUDE FIXED의 주요 차이점은 아래 표시된 것과 같이 필터링 계층 상의 각 위치입니다.

FIXED LOD 표현식은 차원 필터 전 및 컨텍스트 필터 후에 계산됩니다. 여러 사용 사례에서 이를 활용할 수 있습니다.

 

다음 시간에는 사례에 대해서 배워보도록 하겠습니다.

다음에 뵙겠습니다~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

 

안녕하세요, 디포커스 태블로 둥이입니다~!

'Exclude: 더 높은 세부 수준에서 계산하기' 에 대해서 배워보도록 하겠습니다.

 

다음 시나리오를 가정해 보십시오.

월별 총 Sales(매출) 및 Region(지역)별 총 매출을 확인하려고 합니다. 그러면 다음을 수행해야 합니다.

1. 월별 Total Sales(총 매출) 계산에서 Region(지역)을 제외해야 합니다.

2. 그런 다음 지역별 Sales(매출) 세부 정보를 계산할 때 Region(지역)을 포함해야 합니다.

 

앞서 설명한 영업 데이터베이스를 사용하여 또 다른 예제를 살펴보겠습니다.

 

 

{EXCLUDE [Region] : SUM([Sales])}

Total Sales(총 매출)라는 이 LOD 표현식을 사용하면 모든 지역의 월별 총 매출을 계산할 수 있습니다.

 

위 비주얼라이제이션에서는 Region(지역)이 열 선반에 배치되어 Region(지역), Month()(Order Date(주문일))

비주얼라이제이션 LOD에 영향을 미칩니다.

EXCLUDE 표현식을 사용하면 총 매출을 계산(모든 지역)하면서 지역별 매출 세부 정보를 표시할 수 있습니다.

이에 따라 다음과 같이 비주얼라이제이션 LOD에 비해 상위수준에 있는(, 덜 세부적인) LOD 표현식을 만들었습니다.

 

EXCLUDE 키워드의 핵심은 다음과 같습니다.

Tableau에서는 먼저 비주얼라이제이션 LOD에서 제외된 차원을 삭제하고 해당 차원이 없는 것으로 간주하고

계산을 수행합니다. 그런 다음 그 결과가 시각적으로 표시됩니다.

 

다음 흐름 도표는 Tableau에서 EXCLUDE LOD 표현식이 수행되는 방법에 대한 시각적인 설명입니다.

 

{EXCLUDE [Region] : SUM([Sales])}이라는 표현식을 사용하면 TableauRegion(지역)차원을 제외하고

비주얼라이제이션에서 사용된 모든 차원을 사용하여 매출 합계를 계산합니다.

따라서 모든 지역의 총 매출을 나타내는 월별 단일 값이 산출됩니다.

 

이제 SUM 집계를 사용하는 Total Sales(총 매출) Region(지역)Sales(매출)모두 보여주는 강력한 뷰가 있습니다.

집계를 조합할 수도 있습니다.

예를 들어, LOD 표현식을 변경하여 지역별 합계를 표시하면서 월별 평균 Sales(매출)을 표시하도록 해보겠습니다.

 

 

INCLUDE 표현식과 유사하게 모든 EXCLUDE 표현식은 뷰에 배치될 때 측정값 또는 집계된 측정값으로 사용됩니다.

이러한 유형의 표현식은 '구성 비율' 또는 '전체 평균 차이' 계산 등에 유용합니다.

 

이렇게 Exclude 표현식도 배워보았는데요, 도움이 되셨나요?

다음 시간에는 Fixed 에 대해서 설명해 드리겠습니다.

그럼 또 만나요~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

안녕하세요~! 디포커스 태블로 둥이입니다 ^^

 

오늘은 'Include: 낮은 세부 수준에서 계산하기' 에 대해서 배워볼까 합니다~!

 

이 예에서는 표준 영업 데이터베이스(Tableau에서 제공되는 Superstore 데이터베이스)를 살펴보겠습니다.

여기서 각 행은 특정 항목의 매출을 나타냅니다.

Order(주문)에는 여러 항목이 포함될 수 있으며 주문은 여러 행에 나누어져 입력될 수 있습니다.

즉, 이 데이터베이스의 가장 깊은 수준의 세부 수준은 고유한 항목입니다.

 

데이터베이스 스냅샷의 첫 번째 행은 Bush Somerset Bookcase(부시 서머셋 책장) 2개에 대한 구매입니다.

두 번째 행은 Hon Stacking Chairs(혼 스태킹 의자) 3개에 대한 구매입니다.

이 두개의 행이 단일 주문인 주문 CA-2013-152156을 구성합니다.

지역별 영업 실적을 분석하고 있는 경우 평균 주문 규모가 가장 큰(또는 작은) 지역을 파악하려면 어떻게 해야할까요?

 

이 정보를 파악하려면 주문별 규모를 계산(각 Order ID에 해당하는 매출 합계를 산출)한 다음 해당 값에 대한

지역별 평균을 산출해야 합니다.

이 비즈니스 질문은 충분히 물어볼 가능성이 있는 질문이며 새로운 LOD 표현식 구문을 사용하면 Tableau에서

이에 대한 답변을 쉽게 구할 수 있습니다.

 

다음은 새로운 구문에 대한 좀 세부적인 설명입니다.

 

{INCLUDE [Order ID] : SUM([Sales])}

LOD 표현식은 여기서 볼 수 있는 것처럼 계산 에디터에서 작성할 수 있습니다. 이 LOD 표현식은 각 Order ID별 구매

합계를 구하기 위해 사용되었습니다. 그 결과는 Order Size(주문 규모)라는 새로운 필드입니다.

 

왼쪽의 막대는 LOD 표현식으로 계산된 Region(지역)별 평균 주문 규모를 보여주는 반면 ,

오른쪽의 막대는 Region(지역)별 평균 Sales(매출)을 보여줍니다.

예를 들어 주문관 상관없이 모든 주문라인 항목의 평균). 이제 다음 질문에 대한 답변을 구할 수 있습니다.

평균 주문 규모가 가장 큰 Region(지역)은 어디입니까?

 

북부 아시아와 중부 아시아가 각각 $737 및 $733로 평균 Order Size(주문 규모)가 가장 크다는 것을 볼 수 있습니다.

비쥬얼라이제이션에 Order ID(주문 ID)가 표시되지 않음에도 불구하고 이 정보를 파악할 수 있습니다.

(Tableau버전9 이전에는 뷰에 Order ID(주문 ID)를 추가하지 않고 해당 값을 계산할 수 없었습니다.)

그림의 오른쪽 막대에서 볼 수 있듯이 Region(지역) 및 AVG(Sales)를 표시했다면 원하는 결과가 아닌 Region(지역)별

모든 라인 항목의 평균이 표시되었을 것입니다.

반면에 Order Size(주문 규모)에 대한 LOD 표현식의 경우 주문별 규모를 먼저 구한 다음 (즉, 주문 내 모든 라인 항목의

매출합계) 해당 주문 결과에 대한 Region(지역)별 평균을 구해 Region(지역)별 Order Size(주문규모)를 구할 수 있습니다.

 

이제 평균 주문 규모가 가장 큰 지역을 파악했으니 조금 더 복잡한 질문을 해보겠습니다.

 

영업 데이터베이스에 있는 국가 중 평균적으로 '규모가 가장 큰 거래'를 성사시키는 영업 담당자들이 속한 국가가

어느 곳입니까? 수행하려는 작업은 다음과 같습니다.

1. 영업 담당자별 성사시킨 가장 규모가 큰 거래(최대값 거래)를 찾은 다음

2. 해당 '최대 규모 거래'에 대한 국가별 평균을 구합니다.

이 질문에는 여러 측면이 있지만 LOD 표현식을 사용하면 답변을 쉽게 구할 수 있습니다.

 

AVG({INCLUDE [Sales Rep] : MAX([Sales])})

Avg Largest Sales Deal by Rep(담당자별 평균 최대 규모 영업 거래)라는 LOD 표현식이 영업 담당자별 평균 최대값

거래를 계산하기 위해 사용되었습니다. 이 경우 LOD 표현식의 평균이 계산 에디터 창에 직접 입력됩니다.

 

 

이 질문에 대한 답변은 복잡한 수식 없이 하나의 표현식인 AVG({INCLUDE [Sales Rep] : MAX([Sales])})로 구할 수

있었습니다. 실제로 뷰에 차원을 추가하여 데이터에 대한 추가 질문을 할 수도 있으며 이 경우 계산이 업데이트됩니다.

예를 들어, 분석에 Year(연도)를 추가해 보겠습니다.

 

 

계산에서 INCLUDE 키워드를 사용하면 Sales Rep(영업 담당자) 필드가 계산에 명시적으로 포함되지만

비쥬얼라이제이션에 배치된 모든 다른 차원도 포함됩니다. (이 경우 Country(국가) 및 Year(연도)).

뷰에 Year(연도)를 추가하면 분석을 더욱 깊이 있게 수행하여 다음과 같은 정보를 얻을 수 있습니다.

2012년에는 바레인의 평균 '최대 규모 거래'가 $4,069로 가장 높았습니다.

 

다음 흐름 도표는 Tableau에서 INCLUDE LOD 표현식이 수행되는 방법을 시각적으로 설명합니다.

 

INCLUDE 키워드는 비쥬얼라이제이션 LOD에 비해 집계 수준이 낮은 (즉, 더 세부적인) 표현식을 만듭니다.

지정된 차원은 계산이 수행되기 전에 비쥬얼라이제이션 LOD에 먼저 추가됩니다.

INCLUDE 표현식은 뷰에서 집계된 측정값으로 사용되었습니다.

실제로 모든 INCLUDE 표현식은 뷰에 배치될 때 측정값 또는 집계된 측정값으로 사용됩니다.

 

다음 시간에는 Exclude 를 배워보도록 하겠습니다.

오늘도 수고하셨습니다 ^^ 다음에 또 만나요~!

 

태블로를 이용한 쉽고 빠른 데이터 시각화는 디포커스의 전문가(http://www.dataqrator.com)가 도와드립니다.

+ Recent posts