본문 바로가기

시사상식

데이터 시각화 이유

반응형

데이터 시각화 이유

데이터의 가치

IDC(Integernational Data Corporation)에 따르면, 2022년까지 전 세계 데이터 시장은 2600억 달러로 성장할 것을 전망된다고 한다. 이와 같이 데이터의 가치는 지속해서 성장하고 어마어마하게 많이 쌓이고 있다. 하지만 이를 어떻게 활용을 할 수 있는지에 대한 방법은 여러가지가 있으며 어떤것들이 제일 효율적인지에 대한지는 산업별, 데이터의 종류별로 각자 다 다르다. 따라서 엄청나게 쌓인 데이터라도 어떻게 잘 활용을 할 수 있을 것인가? 에 대해 고민을 해봐야 한다.

더 많은 데이터에 접속할 수 있는 상태지만, 이런 수많은 데이터에서 효과적으로 인사이트를 획득하는 능력은 감소했다. 최근 MIT 슬론 경영대학원 리뷰에 실린 글에 따르면, 2016년에서 2017동안 데이터 '접속'과 '인사이트 획득 효과성'의 간극이 지난 6년간 최대인 50%로 확대됐다. 데이터가 많다고 항상 더 좋은 결과를 얻을 수 있는 것이 아니라는 것을 확인할 수 있었다. (InfoWorld, Paul Bruent / 그롤벌 칼럼 '빅데이터를 제대로 활용할 수 있도록 돕는 '데이터 거버넌스')

 

 

데이터를 어떻게 활용해야 하는가?

과거에는 데이터 활용 역량에 '데이터 분석'과 '시각적 스토리텔링' 역량이 있었으며, 이 두 가지 역량간 경계가 뚜렷했었다. 먼저, '데이터 분석' 역량은 기술적으로 데이터를 수집하고 정제하는 데이터 가공 단계부터 분석 기법을 활용한 데이터 분석에 이르는 과정에 필요한 능력을 말한다. 그리고 '시각적 스토리텔링' 역량은 데이터 분석 결과를 시각적으로 표현해 스토리텔링을 하는 능력이다.

하지만 위 두가지 모두 아우를 수 있는 '데이터 시각화' 역량이 최근 강조되고 있다. 데이터 시각화는 기술적으로 데이터를 다루는 전문 역량이 없어도, 시각적 스토리텔링을 위한 디자인 역량이 없더라도 데이터를 활용한 인사이트 발굴과 스토리텔링을 할 수 있도록 돕는다. 그도 그럴것이 단순히 숫자와 글자로 나열된 데이터들로 추이를 분석하고 이를 통해 인사이트를 발굴 하는것이 당연히 사람의 눈에 보기 좋게 시각화된 데이터들을 통해서 이루어지는 것 아닐까? 당연하다고 생각하는 그 이유를 다음에서 풀어보겠다.

 

 

데이터를 왜 시각화 해야 하는지

1. 많은 양의 데이터를 한눈에 볼 수 있다
데이터 시각화는 많은 양의 데이터를 시각적 요소로 활용해 요약해 표현한다. 한눈에 볼 수 없는 만은 양의 데이터를 한 번에 볼 수 있도록 한다. 또한, 데이터 시각화에는 다양한 형태의 유형이 있는데, 이들은 데이터가 의미하는 바를 쉽게 찾고, 이해할 수 있도록 돕는다. 가령, 차트에 활용된 도형의 크기, 위치나 색의 정도를 바탕으로 데이터 크기를 비교하고, 분포를 파악하거나 관련성을 찾을 수 있다. 즉, 데이터 안에 숨겨진 유의미한 이야기, 데이터 인사이트를 발견할 수 있다. 이는, 인포그래픽과 차이가 분명 존재하는데, 인포그래픽은 주로 정적인 형태의 차트 이미지로, 데이터 분석에 결과에 대한 고정적인 메시지를 전달한다. 반면, 데이터 시각화는 정렬, 필터, 확대 및 축소 등의 인터랙티브 기능을 독자에게 제공함으로써 시각화 결과물과 상호작용하며, 데이터를 탐색할 수 있다. 즉, 능동적인 데이터 탐색을 바탕으로 자신만의 데이터 인사이트를 발견할 수 있다. 이러한 이유로 데이터 시각화가 필요하다.

 

2. 데이터 분석에 대한 전문 지식이 없어도, 누구나 쉽게 인사이트를 찾을 수 있다
일반 사람은 감각기관을 통해 획득하는 정보의 80%는 시각을 통해 이루어진다. 따라서 데이터 시각화는 인간이 받아들이게 아주 효과적인 방법이다. 차트의 시각적 패턴을 근거로 데이터의 추세는 어떤지, 다른 값들과 구별되는 이상값을 빠르게 찾을 수 있다. 데이터 분석을 위한 수학적, 통계적 전문 기술 없이도, 시각적 패턴을 근거로 누구나 쉽게 데이터 인사이트를 찾을 수 있다. 따라서 시각화를 통해 데이터 활용 범위가 넓어지고, 나아가 새로운 가치 창출의 범위가 확대된다고도 할 수 있다.
그뿐만 아니라 같은 맥락에서 데이터 시각화 차트를 활용하고, 차트의 시각적 패턴을 근거로 한 스토리텔링은 사람들의 기억에 오래 남는다. 데이터를 기반으로 내가 찾은 인사이트를 다른 사람에게 강력하게 전달하기 위해서 시각화를 활용해야 한다. 데이터 시각화 차트는 목적에 따라 다음과 같이 나눌 수 있다.

  • 막대 차트, 버블 차트 : '비교'

  • 선 차트, 영역 차트, 타임라인 차트 : '시간 흐름에 따른 데이터의 변화'를 보기 위함

  • 파이 차트, 트리맵 차트 : 전체 데이터 중 특정 항목이 차지하는 '비중'을 보기 위함

  • 산점도, 네트워크 시각화 : 데이터간의 관계를 보기 위함.

3. 요약 통계보다 정확한 데이터 분석 결과를 도출할 수 있다

일반적으로 데이터 시각화는 데이터 분석 결과를 다른 사람들에게 전달하기 위한 '보여주기' 용도로 생각하지만 정확한 분석을 위한 데이터 탐색 방법으로 활용된다. 실례로, Alberto Cairo의 데이터 셋을 나열된 숫자로만 보았을 경우에는 정상적인 통계처럼 보이지만 시각화하면 공룡 모양의 형태를 보이고 있다. 이러한 실례를 통해 정확한 데이터 이해를 위해 데이터 분석 과정에서 시각화를 필수적으로 해야한다는 결론에 이르게 된다. 그리고 이를 통해 데이터를 정확하게 이해하고, 데이터를 탐색하여 인사이트를 도출한다.

 

 

4. 해당 데이터에 대한 효과적인 인사이트 공유로 데이터 기반의 의사결정을 할 수 있다

보고서, 프레젠테이션 문서에 삽입된 시각화 차트는 메시지 전달을 효과적으로 뒷받침하는 근거 자료로 역할을 한다. 앞서 언급했듯이 시각화 자료는 사람들의 머릿속에 빠르게 인지되고 기억될 뿐만 아니라, 메시지의 스토리텔링에 대한 공감을 더하기 때문이다. 또한, 기업 혹은 조직단위에서 데이터 대시보드를 활용함으로써 구성원들과 효율적으로 데이터 공유를 하고 인사이트를 도출하여 데이터 기반의 의사결정을 할 수 있다.

 

 

5. 데이터 시각화를 활용할 수 있는 분야와 방법이 무궁무진하다
데이터 시각화는 데이터가 있는 곳이라면 어디에서든지 활용할 수 있다. 실례로, 정부의 데이터 개방 정책과 맞물려 데이터 활용 활성화 방법으로 제공되고 있는 시각화 서비스다. 대민 서비스이기 때문에, 누구나 데이터 개방 포털에 접속해 개인이 보유한 데이터를 활용해 시각화 차트를 만들 수 있다.
또한, 산업 및 기업 차원에서는 보유 데이터의 활용도로를 높이기 위해 데이터 시각화를 도입하고 있다. 사내 KPI(Key Performance Indicator) 지표 등 성과 지표 추적, 데이터 기반의 마케팅 활성화 등을 위한 목적으로 데이터 대시보드를 구축하고 활용하는 것이 일반적이다.
실례로, 신한은행은 임원진이 경영 관련 빅데이터를 시각화 자료로 실시간 모니터링하고, 의사결정 할 수 있는 '빅데이터 워룸'을 만들었다. KEB하나은행도 은행 핵심 경영지표, 조직 단위별 영업 실적 모니터링, 고객 특성에 따른 비정형 분석 등 은행 내부 데이터를 숫자가 아닌 시각화 형태로 확인할 수 있는 BI '하나 빅 인사이트'를 구축했다.

 

 

 

최근 가트너(Gartner) 리포트 '2017 예측 : 분석 전략과 기술(Predicts 2017 : Analytics Strategy and Technology)'은 '시민 데이터과학자' 개념을 언급했다. 시민 데이터과학자란 기존 데이터과학자에게 요구되었던 고도화된 전문 분석 기술 없이도 데이터를 분석할 수 있는 사람을 의미한다. 데이터과학이 산업 전반에 걸쳐 영향력을 발휘하고 있는 현실을 반영할 때, 2019년에는 양적 차원에서 이들의 규모가 기존 데이터과학자 수를 압도할 것으로 예측했다. 이러한 이유를 통해 데이터 시각화를 통해 데이터 분석과 인사이트 도출을 좀 더 잘할 수 있지 않을까 싶다.


반응형