안녕하세요? 데이터 전문가 '큐레이터 입니다.'

앞서, 태블로 10(Tableau V10)의 출시를 알리는 글과 함께, 

새로 탑제될 신기능인

'클러스터링' 분석에 대해서 설명 드린바가 있습니다.



그런데 도대체....클러스터링이 뭘까요?

지금부터 함께 알아보도록 하겠습니다.

(본 게시물은 Tableau Blog의 Andy Cotgreave의 게시물을 참고했습니다.)


태블로 10의 가장 놀라운 신기능 중 하나인, 클러스터링은 사용자들로 하여금 아주 복잡한 통계적 툴을 사용해야 했던 절차를, 단순 드래그&드랍만으로도 이용할 수 있게 해줍니다.


 사실 저와 또 대부분의 태블로 이용자들은 통계 분석 전문가가 아니기 때문에 너무 깊은 단계까지의 클러스터링에 대한 이해는 필요 없습니다만,

저희에게 중요한 것이 두가지 있습니다.

"클러스터링은 무엇이고, 왜 필요한가"


클러스터링은 그룹핑과 유사한 개념 입니다.

하지만 일반적인 그루핑과는 다르게 클러스터링 기능을 이용하면

데이터들의 특성을 고려하여 자동적으로 데이터들을 각각의 덩어리(클러스터)로 그룹지어서 시각적으로 보여주게 됩니다.

아래의 짧은 영상을 참고하시겠습니다.




굉장히 쉽고 인상적입니다. 그렇다면 실제로 적용도 가능할까요?

아래의 영상은 글로벌 여행사에서의 사용을 가정한 영상입니다.




그렇다면 구체적으로 우리는 클러스터링 기능을 통해 

앞으로 무엇을 할 수 있게 될까요?


비록 우리가 통계 전문가는 아니지만, 사실 우리는 통계모델을 사용하는 것이 얼마나 위험한지에 대해서는 잘 알고 있습니다.

"상관관계는 인과관계와는 다르다" 와 같은 격언들이 말하듯이

트렌드 라인 분석혹은 회귀분석을 시행할 때 우리는 상당한 주의를 기울여야 한다는 것 또한 알고있습니다.

그렇다면, 클러스터링 모델을 통해서 만들어진 그룹을 통하여 결론을 도출하는 것은 위험한 일 일까요?


태블로 전문가 Bora Beran은이렇게 말 합니다.

"클러스터링은 데이터를 세분화 해줍니다. 클러스터링의 좋은점은 더 이상 데이터를 외삽법과 같이 '추정' 할 필요가 없다는 것 입니다." 


"클러스터링은 데이터를 그룹화 하거나, 집합 시키는 또 다른 방법입니다."

SPSS에서 근무했던, 태블로의 세일즈 컨설턴트 David Sigerson은 말합니다.

"여러분은 클러스터링을 이용해서 

다양한 조건의 그룹을 생성할 수 있습니다."


정리하자면 이렇습니다.


클러스터링이란 기존의 그루핑과 비슷하지만, 일일히 데이터를 선택해서 그룹을 지어야 했던 기존과 다르게 모델을 이용해서(더 높은 정확도를 원한다면 K-means 클러스터링을 사용해서) 그룹을 만드는 것 이다.

'

더 자세한 클러스터링과 태블로 10에 대한 이야기가 듣고 싶으시다면

저희 큐레이터의 '9월 태블로 정기교육'에서 저희를 만나보실 수 있습니다


신청하기: www.dataqrator.com/edu




참고자료 보기


+ Recent posts