본문 바로가기

정보시각화 소식

인간 질병 네트워크

지난 3월 뉴욕타임즈 홈페이지에 "인간 질병 네트워크"를 시각화한 그림이 게재되었습니다.

사용자 삽입 이미지

인간 질병 네트워크

 모든 사람은 DNA안에 유전자를 가지고 태어납니다. 유전자는 자손을 낳는 일 뿐 아니라, 일상적인 생명활동에도 아주 중요한 역할을 합니다. 그래서 어떤 이유에서 유전자가 고장이 나면 병이 나게 됩니다. 고장난 유전자의 종류에 따라 병의 종류도 달라지게 되죠. 위 네트워크는 바로 그런 질병과 유전자 사이의 상관관계를 표현한 것입니다.  

우선 동그라미로 표시된 것이 질병이나 장애를 뜻합니다. 동그라미의 크기는 그 병에 관련한 유전자의 개수를 뜻합니다. 클 수록 관여하는 유전자가 많다는 뜻이죠. 그리고 비슷한 종류의 질병은 같은 색깔의 동그라미로 되어있습니다. 그리고 이것이 위 네트워크 표현의 가장 중요한 부분인데요. 어떤 유전자가 두 가지 종류의 병에 모두 연관이 있으면, 두 질병사이에 선을 연결했습니다. 선 중간에 사각형은 바로 두 질병과 동시에 연관이 있는 유전자를 뜻하죠. 

따라서 선으로 연결되어있는 두 질병은 연결되어있지 않은 다른 두 질병에 비해 상관관계가 높다 할 수 있습니다.

이처럼 네트워크를 그려보면, 전체적인 상관관계 구조를 좀 더 잘 파악할 수 있습니다. 예를 들어 위 네트워크에서 심근병증(Cardiomyopathy)과 귀먹음(난청, Deafness)이 바로 연결되어있는 것을 볼 수 있는데요. 제가 의학을 몰라서 그럴진 모르겠습니다만, 평소라면 두 질병이 상관관계가 높을 거라 상상하기는 쉽지 않겠죠.

네트워크가 강력한 시각화 방법이긴 하지만, 적용하기에 어려운 점이 있습니다. 바로 노드(node, 위 그림에서 동그라미를 뜻함)가 너무 많으면 선을 알아보기에 너무 복잡해진다는 점입니다. 뉴욕타임즈 그림은 같은 색깔의 동그라미를 적당히 비슷한 곳에 위치시키고, 위 그림처럼 돋보기 기능을 제공하는 방법으로 난점을 극복했네요.

참고로, 위 그림은 고려대 물리학과의 고광일 교수님이 쓰신 2007년 PNAS(미국 학술원회보) 논문에서 비롯한 것입니다. 뉴욕타임즈 홈페이지에는 그림의 출처로 논문 공동저자인 Vidal, Barabasi, Cusick의 이름을 썼네요. Barabasi는 국내에 소개된 책 <링크>의 저자이자 척도 없는(scale-free) 네트워크 이론의 창시자 중 한 명입니다. 네트워크 이론 쪽에서는 굉장히 유명한 분이죠.

더 관심있으신 분은 아래 논문을 참조하세요.

논문 출처: K.-I. Goh., M. E. Cusick, D. Valle, B. Childs, M. Vidal, and A.-L. Barabasi, The human disease network, PNAS, vol. 104, no.21, 8685-8690

논문 링크: http://www.pnas.org/cgi/content/full/104/21/8685