지난 3월 뉴욕타임즈 홈페이지에 "인간 질병 네트워크"를 시각화한 그림이 게재되었습니다.
인간 질병 네트워크
우선 동그라미로 표시된 것이 질병이나 장애를 뜻합니다. 동그라미의 크기는 그 병에 관련한 유전자의 개수를 뜻합니다. 클 수록 관여하는 유전자가 많다는 뜻이죠. 그리고 비슷한 종류의 질병은 같은 색깔의 동그라미로 되어있습니다. 그리고 이것이 위 네트워크 표현의 가장 중요한 부분인데요. 어떤 유전자가 두 가지 종류의 병에 모두 연관이 있으면, 두 질병사이에 선을 연결했습니다. 선 중간에 사각형은 바로 두 질병과 동시에 연관이 있는 유전자를 뜻하죠.
따라서 선으로 연결되어있는 두 질병은 연결되어있지 않은 다른 두 질병에 비해 상관관계가 높다 할 수 있습니다.
이처럼 네트워크를 그려보면, 전체적인 상관관계 구조를 좀 더 잘 파악할 수 있습니다. 예를 들어 위 네트워크에서 심근병증(Cardiomyopathy)과 귀먹음(난청, Deafness)이 바로 연결되어있는 것을 볼 수 있는데요. 제가 의학을 몰라서 그럴진 모르겠습니다만, 평소라면 두 질병이 상관관계가 높을 거라 상상하기는 쉽지 않겠죠.
네트워크가 강력한 시각화 방법이긴 하지만, 적용하기에 어려운 점이 있습니다. 바로 노드(node, 위 그림에서 동그라미를 뜻함)가 너무 많으면 선을 알아보기에 너무 복잡해진다는 점입니다. 뉴욕타임즈 그림은 같은 색깔의 동그라미를 적당히 비슷한 곳에 위치시키고, 위 그림처럼 돋보기 기능을 제공하는 방법으로 난점을 극복했네요.
참고로, 위 그림은 고려대 물리학과의 고광일 교수님이 쓰신 2007년 PNAS(미국 학술원회보) 논문에서 비롯한 것입니다. 뉴욕타임즈 홈페이지에는 그림의 출처로 논문 공동저자인 Vidal, Barabasi, Cusick의 이름을 썼네요. Barabasi는 국내에 소개된 책 <링크>의 저자이자 척도 없는(scale-free) 네트워크 이론의 창시자 중 한 명입니다. 네트워크 이론 쪽에서는 굉장히 유명한 분이죠.
더 관심있으신 분은 아래 논문을 참조하세요.
논문 출처: K.-I. Goh., M. E. Cusick, D. Valle, B. Childs, M. Vidal, and A.-L. Barabasi, The human disease network, PNAS, vol. 104, no.21, 8685-8690
'정보시각화 소식' 카테고리의 다른 글
네트워크 시각화 갤러리 (0) | 2008.06.08 |
---|---|
영화의 물결 - 뉴욕 타임스의 시각화 사례 (0) | 2008.05.30 |
Gapminder - 대화식 데이터 시각화 도구 (0) | 2008.05.30 |
Twistori - 다른 사람의 생각을 엿보기 (0) | 2008.05.29 |
Tag Galaxy - Flickr 태그를 우주로! (0) | 2008.05.26 |