본문 바로가기

정보시각화 소식

글 속에 숨은 관계를 보자 - 이은말 네트워크(Phrase Network)

이은말 네트워크


시각화 관련 사이트인 Many Eyes이은말 네트워크(Phrase Network) 시각화 기능이 추가됐습니다. 글 속에서 단어 사이에 연관관계를 찾아서 방향성 있는 네트워크(directed network) 형태로 보여주는 기능입니다.

위 스크린샷은  Walt Whitman가 쓴 "Leaves of Grass"란 글에서 찾아낸 이은말[각주:1] 네트워크입니다. 화살표는 "and"로 이어진 앞 뒤 두 단어를 이은 것입니다. 예를 들면 이런 식이죠.

"men and women" :
men  -> women

 화살표가 굵을 수록 "and"로 이어진 관계가 많다는 뜻입니다. 단어의 크기는 그 단어가 글 속에서 나타난 빈도수에 비례합니다. 단어가 짙은 남색일 수록 "단어1 and 단어2" 형식에서 앞에 나오는 "단어1"에 해당하고, 옅은 색일수록 뒤에 있는 "단어2"가 됩니다.

메뉴


"and" 로 이어진 네트워크 이외에도 다양한 방식으로 네트워크를 그릴 수 있습니다. 위 메뉴에서처럼 "is"나 "the"로 연결된 네트워크를 볼 수도 있고, 아니면 "* 문자열 *" 같은 방식으로 아예 새로운 연결관계를 지정해줄 수도 있습니다.

Many Eyes 사이트에선 자신만의 데이터를 올려서 이런 시각화 기능을 적용해 볼 수 있습니다. 이 네트워크가 글에 대해서 어떤 새로운 정보를 주는지는 잘 모르겠지만, 한번 재미삼아 시도해볼만 하네요.

바로가기:
http://manyeyes.alphaworks.ibm.com/manyeyes/visualizations/relations-in-leaves-of-grass



  1. 구(句,Phrase)를 "이은말"이라고 쓰기도 합니다. 여기서는 이은말이라는 표현이 더 어울려서 그렇게 번역했습니다. [본문으로]