작성일 : 13-08-17 11:52
[Trend] 빅데이터를 `시각화` 하라… 숨은 정보가 드러난다
   http://news.mk.co.kr/newsRead.php?year=2013&no=724286 [1140]
"매일 2.5퀸틸리언(Quintillion) 바이트의 데이터가 쌓이고 있다. 지금 우리가 보유하고 있는 데이터의 90%는 지난 2년 사이에 축적한 것이다."

IBM 홈페이지에 나와 있는 빅데이터에 대한 첫 대목이다.

`퀸틸리언`(100경)의 규모가 어느 정도인지 감이 오지 않는가? 내가 카드를 사용하고, 온라인쇼핑을 하고, 내비게이션으로 경로를 검색하고, SNS에 글과 사진을 올리는 모든 행위가 빅데이터의 일부가 되고 있음을 떠올려보자. 누군가는 우리 모두가 `하루하루 숨을 쉬며 이산화탄소를 내뱉듯` 데이터를 쌓고 있다는 표현을 쓰기도 했다. 하지만 `날것`으로 존재하는 데이터는 어떤 의미도 주지 못한다. 방대한 숫자의 나열과 엑셀의 자료 더미는 우리에게 스트레스만 가져다줄 뿐이다. 그래서 이런저런 재료와 솜씨를 이용해 쏟아져 나오는 데이터를 재구성해 `의미`를 찾아내고자 하는 움직임이 큰 화두가 되고 있는 것이다.

하지만 빅데이터 분석 기술의 발전에도 불구하고 여전히 방대한 데이터의 홍수 앞에서 그 의미가 무엇인지 잘 모르고 헤매기 쉽다. 이럴 때 `데이터 시각화(Data Visualization)`가 하나의 대안으로 등장한다.

데이터 시각화는 낯선 방법이 아니다. 선거 개표 방송과 날씨 예보에서 흔히 볼 수 있는 그래픽 효과와 파워포인트, 엑셀 등의 도구를 통해서 표현되는 파이 차트, 막대그래프 등도 모두 데이터 시각화 작업에 속한다. 신문의 `인포그래픽(Infographic)`도 데이터 시각화의 대표적 사례다.

하지만 빅데이터의 시각화는 정보를 보다 명확하고 효과적으로 전달하는 데 그치지 않는다. 무작위적으로 쏟아져 나오는 방대한 분량의 데이터 파편을 나와 관계를 맺게 하고 그 안에 숨겨진 패턴과 의미를 발견하기 위한 시도가 이어졌다. 2년 전 인텔(Intel)은 페이스북 이용자 데이터를 가상의 미술관 작품 형식으로 바꾸어주는 `나만의 미술관(The Museum of Me)` 캠페인을 펼쳤다. `나만의 미술관`에서는 페이스북 친구의 얼굴이 액자 속 인물화처럼 전시되고, 자신의 담벼락에 자주 등장한 단어 목록이 예술 작품처럼 표현된다. 소셜 활동에서 파생된 데이터의 조각들을 통해 내가 누구인지를 드러내주는 의미 있는 시각 체험 작업으로 평가 받는다.

인텔은 페이스북 이용자 데이터를 가상의 미술관 작품 형식으로 바꾸어주는 ‘나만의 미술관(The Museum of Me)’ 캠페인을 펼쳤다.
국내에선 `티맵(T map)`의 경로 데이터 시각화 작업이 눈에 띈다. 1700여만 명의 가입자가 하루 평균 100만건 이상 검색하며 생겨나는 내비게이션 데이터는 문자와 기호와 숫자로만 이루어져 있다. 저장한계 때문에 최소한 필요 정보만 남겨 놓고 사라져가는 방대한 데이터를 우리에게 의미 있는 것으로 보여주기 위해 티맵의 이동 경로를 3차원 빛의 궤적으로 시각화한 프로젝트다. 앞서 살펴본 해외 사례와 마찬가지로 시각화된 데이터가 정보를 전달하는 수준을 넘어 바쁘게 달려가는 현대인의 삶의 궤적을 감성적으로 느끼게 해주는 시도로 평가받고 있다.

데이터 시각화는 그 어떤 논문보다도 훨씬 더 효과적으로 사회적 현상을 증명해보이기도 한다.

IBM의 와텐버그(Martin Wattenberg)와 비에가스(Fernanda Viegas)는 위키피디아에 등재되는 글이 쓰이고 편집되는 과정을 시각적으로 추적하는 데이터 시각화 도구 `History Flows`를 개발했다. 이를 통해 시각화해보면 `낙태` `이슬람` 등과 같이 첨예하게 대립하기 쉬운 주제의 글이 악의적으로 삭제될 경우 누군가에 의해 빠른 시간 내에 원상태로 복구되는 모습과 공동 저자들에 의해 위키피디아의 글이 편집되고 진화해 가는 모습이 `그랜드캐니언`의 형상처럼 표현되는 컬러 그래프의 추이를 통해 확연하게 파악할 수 있다.

데이터 시각화가 사람들의 관점을 변화시키고 세상을 이롭게 하는 행동을 촉구하기 위해 쓰이기도 한다. IBM은 최근 창립 100주년을 기념해 뉴욕에서 `THINK` 전시회를 열고 40m 길이의 `데이터 전광판(Data Wall)`을 선보였다. 전시회장 주변의 각종 데이터, 예를 들면 브로드웨이의 교통상황에서부터 식수부족, 대기오염, 카드사고 현황 등에 이르기까지 뉴욕의 현재 삶을 느끼게 해주는 데이터를 실시간으로 시각화해서 보여준다. IBM은 이곳을 방문하는 사람들이 주변에서 어떤 일이 일어나고 있는지를 제대로 알게 하고 삶을 개선시킬 여지가 충분히 있음을 깨닫게 함으로써 세상을 지금보다 더 이롭게 만드는 것을 목적으로 이 데이터 시각화를 기획했다고 했다.

기술의 발전에 힘입어 데이터 시각화 솔루션은 한층 정교해지고 표현 기법은 점점 다양해지고 세련돼지고 있다. 전문가의 몫으로 여겨져 왔던 데이터 시각화는 지금은 사람들이 누구나 손쉽게 접근하여 그 의미를 직접 탐색해 볼 수 있게 됐다.
데이터 시각화는 정보를 직관적으로 파악하게 하는 데 그치지 않고 정서적인 교감을 불러일으킴으로써 브랜드에 대한 감성적 스토리 전달을 가능하게 한다. 그리고 사람들의 관점을 변화시키고 행동 변화를 촉구해 세상을 이롭게 만드는 데 기여하기도 한다. 빅데이터 시대에 살고 있는 우리가 실용과 아름다움을 겸비한 데이터 시각화에 주목해야 할 이유다.

[강영훈 SK플래닛 M&C부문 그룹장]

- 매일경제 2013.08.17