본문 바로가기

정보시각화 소식

데이터 시각화 스케치 - Google의 새로운 시도?


미국 오레곤(Oregon) 주의 포트랜드(Portland)에 있는 Grid/planeInstrument란 디자인 스튜디오에서 작년에 데이터 시각화 프로젝트를 했다고 합니다. 고객은 다름 아닌 Google입니다.

Google 사이트 디자인은 단순하다 못해 투박하죠. 그런데 이렇게 외부 디자인 회사에 데이터 시각화 프로젝트를 외주 주는 것보니 Google도 깔끔한 디자인에 관심이 전혀 없는 것은 아닌 모양입니다.

프로젝트 설명을 읽어보면, 블로그와 같은 소셜 미디어(Social Media)에 관한 시각화 프로젝트라고 합니다. 미디어에 방문하는 이용자 수 같은 기본 데이터를 보여주는 것을 넘어서, 해당 미디어의 영향력까지도 시각화하는 것을 목표로 한 모양입니다. Googal Analytics 데이터를 기반으로 Flash로 만들었다고 합니다.

아쉽게도 이 프로젝트가 실제로 작동되는 모습은 볼 수가 없고, 공개된 스크린샷만 볼 수 있습니다. 하지만 스크린샷만으로도 어느 정도는 Google의 꿍꿍이를 짐작할 수 있죠. 하나씩 살펴볼까요?


옆의 동그라미 안에 NEWS, BLOGS, SOCIAL라고 씌어 있습니다. 크게 뉴스, 블로그, 소셜(아마도 Twitter 같은 소셜 네트워크 서비스를 말하는 모양입니다.)로 분류해서 보겠다는 뜻이겠죠. 가운데에는 네트워크가 그려져있는데, 블로그 사이에 링크 관계를 표현한 듯 합니다.  동그라미 안의 숫자는 해당 미디어의 '영향력'을 평가하는 숫자로 보입니다. 디자인 회사가 한 것이니 영향력을 평가하는 알고리즘까지 고민했을 것 같진 않군요.


이런 네트워크 레이아웃(lay-out)은 흔합니다. 보통 자기 중심 네트워크(ego-centered network)라고 하죠. 어떤 한 사이트를 클릭하면 그에 연관한 다른 사이트들을 나열해주는 것 같습니다. 원의 크기는 '영향력'에 비례하도록 그린 것 같군요.
밑의 슬라이드에는 날짜가 적혀있는데, 시간 창(Time window)를 설정해서 볼 수 있게 하겠다는 뜻 같습니다. 


영향력 기준으로 나열한 막대그래프 형식이겠죠.


블로그 클러스터(Cluster)를 클릭하면 그 안에 세부 사이트의 영향력을 보여주겠다는 뜻 같습니다.


어느 지역에 있는 사이트가 영향력이 높은지 보여주겠다는 뜻인 것 같죠?


영향력의 시간 변화를 시계열 형식으로 보여주는 것 같습니다. 사실 이런 식으로 시계열을 보여주면 예쁘긴 해도 별로 실용성은 없죠. 


이건 무슨 의미로 원을 배치했는지 알기가 어렵군요.


링크를 표현할 때 원형 레이아웃(lay-out)을 꽤 많이 시도하는 것 같습니다. 일단 공간을 덜 차지하고 예뻐보인다는 장점이 있죠. 하지만 글자를 읽기는 좀 불편하죠. 


이건 그냥 서비스용 컨셉인 것 같습니다. 예쁜 것 말고 별다른 의미는 없겠죠.



스크린 샷을 자세히 보면 리퍼러 별로 무언가를 보여주고 있습니다.

이 프로젝트는 소셜 미디어의 '영향력'을 시각화하는 것이죠. 그렇다면 '영향력'을 어떻게 평가하고 수치화할 것인가?라는 문제가 있습니다.

어떤 사이트의 '영향력'을 평가한다고 한다면, 보통은 Google을 유명하게 만든 PageRank를 떠올리게 됩니다. PageRank는 해당 사이트에 링크가 얼마나 많이 걸렸나를 기준으로 랭킹을 매기는 방식이죠. 하지만 이 스크린샷에서는 리퍼러가 표시되어있습니다. 여기서 한가지 가정을 해볼 수  있어요. 소설 미디어의 '영향력'을 평가하는데 Google이 혹시 리퍼러 정보를 활용하려는 것은 아닐까? 라는 거죠.

 리퍼러 정보는 실 방문자가 언제 어느 링크를 타고 왔는지 정확하게 기록합니다. 그래서 만약 리퍼러 정보를 활용할 수 있다면, 링크 정보만 활용하는 PageRank 보다 더 정밀한 '영향력' 랭킹을 매길 수 있겠죠. 하지만 리퍼러 정보는 해당 블로그나 사이트 관리자가 아니면 알기가 어렵다는 문제가 있습니다. 따라서 보통 이 데이터를 검색엔진이 이용하긴 어렵겠죠.

하지만 요새 많은 사이트들이 Google Analytics를 이용하고 있다는 점에 생각이 미치더군요. 아마 대형 사이트들은 거진 사용하고 있을 겁니다. 그러고 보면 Google Analytics에는 사실상 주요 사이트의 리퍼러 정보가 쌓인다고 볼 수 있습니다. 언제 누가 링크를 클릭했는지, 어떤 링크를 타고 왔는지 다 알 수 있다 거죠. 만약 Google이 이 정보를 적극적으로 활용한다면? 아마 다른 검색업체가 쉽게 할 수 없는 어떤 일을 할 수도 있다는 겁니다.

물론 스크린샷만 보고 단순히 추측한 것이니 신빙성은 별로 없습니다. 그래도 제 전공이 디자인보다는 알고리즘 기술 쪽에 훨씬 가깝다보니, 소셜 미디어의 '영향력'을 어떻게 평가할 수 있을까?라는 의문이 먼저 떠오르더군요. :)

여러분들은 이 스크린샷을 보고 어떤 느낌이 드시나요?


바로가기:
http://www.gridplane.com/#/projects/all/data-vis
http://www.weareinstrument.com/#/work/data-visualization