태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

공지) pajek 설명서를 보시고 메일로 문의하시는 분들이 많습니다. 문의 내용이 비슷한 경우가 많으니, 되도록 댓글로 질문 부탁드립니다. 제가 댓글로 답변 드리면 다른 분들도 보실 수 있으니까요. :)


오늘은 pajek에서 사용하는 "Partition"과 "Vector" 데이터 파일 형식을 알아보겠습니다.

pajek에서는 기본적인 Network(.net) 파일 외에도 Partition, Vector, Permutation, Cluster, Hierarchy 파일 형식이 존재합니다. 이 파일 형식들은 Network 데이터의 메타데이터(meta-data)역할을 합니다. 즉, 네트워크를 설명하는 데이터란 거죠.

기타 파일 형식

위 실행창에서 왼쪽에 Networks 밑으로 Partition등이 보이죠? 여기에 데이터 파일을 등록해서 사용할 수 있습니다.

우선 테스트를 위해 랜덤 네트워크를 만들어 봅시다.  다음 메뉴를 클릭하면 간단한 랜덤 네트워크를 생성할 수 있습니다.

메뉴 > Net > Random Network > Total No. of Arcs

점(vertice)의 갯수와 연결선(arc)의 갯수를 물어보는데 각각 5와 10을 입력합시다. 그러면 점이 5개고 연결선이 10개인 랜덤 네트워크가 생성됩니다.  다음 메뉴를 클릭하면 만들어진 네트워크를 확인할 수 있습니다.

메뉴 > Draw > Draw


여기까지는 전에도 해본 것이니 어렵지 않을 겁니다. 그러면 이제 Partition을 만들어봅시다.

메뉴 > Net > Partitions > Degree > Input

위 명령은 노드(점)에 들어오는 방향으로 연결된 링크(연결선)의 숫자에 따라 노드를 파티션(Partition)으로 분류하라는 뜻입니다. (Net> Partitions 밑에 수많은 명령이 있는데 기능은 나중에 설명하도록 하겠습니다.) 위 메뉴를 누르고 나면 기본 창에 Partitions와 Vectors 항목에 새 파일이 생긴 것을 확인할 수 있습니다.


이제 왼쪽 디스켓 아이콘을 클릭해서 데이터 파일을 각각 저장해봅시다.
Netwokr 파일의 기본 확장자는 .net, Partition 파일은 .clu,  Vector 파일은 .vec입니다.  이제 하나씩 확인해볼까요?

.net 파일 (Network)
*Vertices 5
 1 "v1"                                     0.1000    0.5000    0.5000
 2 "v2"                                     0.3764    0.1196    0.5000
 3 "v3"                                     0.8236    0.2649    0.5000
 4 "v4"                                     0.8236    0.7351    0.5000
 5 "v5"                                     0.3764    0.8804    0.5000
*Arcs
 2  1 1
 5  1 1
 1  2 1
 4  1 1
 2  3 1
 2  4 1
 5  3 1
 1  3 1
 3  4 1
 1  4 1

.net 파일은 예전에 설명했으니 자세히 설명하지 않겠습니다. 단, 여기서 노드 뒤에 숫자 세개는 네트워크 그림을 그릴때 노드가 그려질 위치입니다. 저 숫자는 레이아웃을 바꿀때마다 계속 바뀌니 신경 안 쓰셔도 됩니다.

.clu 파일 (Partition)
*Vertices 5
3
1
3
3
0

 Partition 파일은 무척 단순합니다. 숫자의 순서는 노드의 순서를 뜻합니다. 즉, 첫번째 노드는 3, 두번째 노드는 1이란 뜻이죠. 그리고 같은 숫자는 해당 노드가 같은 Partition에 속한다는 뜻입니다. 위 파일대로라면 노드가 {v1, v3, v4}, {v2}, {v5} 세 그룹으로 분류된다는 뜻이죠.

.vec 파일 (Vector)
*Vertices 5
0.75000000000000000
0.25000000000000000
0.75000000000000000
0.75000000000000000
0.00000000000000000

Vector 파일도 Partition 파일과 마찬가지 형식입니다. 단, Vector는 분류 정보가 아닌 임의의 어떤 정보를 담고 있다는 점이 다르죠. 여기서는 (들어오는 방향의 연결선 수)/(총 가능한 들어오는 방향의 연결수)를 뜻합니다. 노드가 총 5개니, 들어오는 링크는 최대 4개까지 가능하죠. 따라서 첫번째 값은 3/4=0.75가 됩니다.

꼭 이런 값 말고도 다른 의미의 값을 줄 수도 있습니다. 예를 들어 "v1 노드에 해당하는 사람이 어떤 일을 할 확률이 0.5이다"라고 하면 그냥 Vector 파일에서 해당하는 칸에 0.5라고 써줄 수도 있습니다. (정보에 일관성만 있으면 됩니다.)


자, 이제 위 데이터 파일을 이용해서 네트워크를 그려봅시다.
아래 메뉴를 누르면 네트워크 그림에 Partition과 Vector 정보를 추가할 수 있습니다.

메뉴 > Draw > Draw-Partition-Vector


차이점이 보이시나요?
노드의 색과 크기가 변했는데, 이는 각각 Partition과 Vector의 정보를 이용한 것입니다.
아까 {v1, v3, v4}, {v2}, {v5} 로 분류되었다고 했는데, v1,v3,v4의 색이 빨간 색으로 같은 것을 볼 수 있습니다. v2는 다른 파티션이라 노란색이죠. v5는 점의 크기가 0이라서 보이진 않지만, 크기를 키우면 역시 빨간색도 노란색도 아닌 다른 색으로 되어있을 겁니다.

노드의 크기는 Vector에서 0.75, 0.25... 등의 값에 비례하게 그려져있습니다.

이제 .clu파일과 .vec 파일을 조작하면 어떤 식으로 네트워크가 그려질지 감이 오셨을 겁니다.


Posted by crefrog

댓글을 달아 주세요

  1. hyun 2009.05.13 10:31  댓글주소  수정/삭제  댓글쓰기

    pajek 입문자입니다..

    글 감사히 보고 있습니다..^^

  2. hyun 2009.05.13 14:31  댓글주소  수정/삭제  댓글쓰기

    한가지 질문이 있습니다..

    도형의 경우에는 비트맵으로 내보낼수가 있어서, 이용하기 쉬운(?) 프로그램에서 볼 수 있는데,

    메뉴얼을 보니, File > Network > Export Matrix to EPS를 통해서 데이터셋을 그림으로 익스포트를 할 수가 있게 되어

    있는 것 같습니다..일단 이게 맞나요?..ㅡ.ㅡㅋ

    근데 eps로만 내보내져서, 열려고 하니 포토샵에서 인식을 못하더라고요..

    이것저것 참고해 보니, 일러에서 열어야 한다 그러는디, 제가 일러가 없어서,

    혹시 일러말고 다른 프로그램에서 열어볼 수 있나요?..아니면 일러에서만 볼 수 있나요?..

    궁금증 좀 해결해주세요..-0-

    • crefrog 2009.05.13 15:06  댓글주소  수정/삭제

      그 옵션은 행렬을 eps 포맷으로 그려주는 옵션입니다. (네트워크가 아닙니다.) eps 형식은 postscript를 지원하는 프로그램(예: ghostview)에서 열수 있을 겁니다.

      네트워크를 그리고 싶으시다면, draw창에서 (draw 메뉴를 선택했을때 새로 뜨는 창)에서 Export 메뉴를 선택하시면 됩니다. 여기에 bmp로 그림을 저장할 수 있는 옵션이 있습니다.

  3. hyun 2009.05.13 15:03  댓글주소  수정/삭제  댓글쓰기

    아..더 찾아보니 gsview라는게 있네요..;;

    열어보니 포토샵에서 깨져서 나오는 줄 알았는데, 그게 아니었네요..;;

    바둑판 형태로 그림이 나오면서 라벨들이 붙는데, 그게 한글들이어서 깨지는게 아닐까 하는 생각만 듭니다..ㅡ.ㅡ

  4. hyun 2009.05.13 15:25  댓글주소  수정/삭제  댓글쓰기

    네..제가 필요한게 네트워크 연결도랑 입력자료들의 데이타셋(매트릭스 형태)가 필요했었는데, 아래 적은 것처럼

    vertice 네임들이 깨져서 나오네요..

    엑셀에서 데이터셋(한글로 입력)을 만들고 exceltopajek으로 *.net 파일 만들고 했는데,

    네트워크도는 한글이 제대로 나오는데, 위의 행렬을 eps로 보냈더니, 한글이 깨져 나오네요..

    예전에 grapher에서도 그랬던 적이 있었는데, 그 떄는 엑셀에서 파일 형식을 달리 해서 grapher에서 받았더니,

    (95로 저장을 했었나...)

    한글이 제대로 나왔던 기억이 있어, 그렇게 한번 해볼까 합니다..그래도 안 나오면 좌절모드로..-0-

    • crefrog 2009.05.13 21:12 신고  댓글주소  수정/삭제

      인코딩 바꿔가면서 해봐도 잘 안되는 걸 보니, eps 만들때 사용하는 글꼴 파일 문제인 것 같습니다. 아마 해결이 안될 것 같네요;

  5. realsit_fly 2010.04.07 16:56  댓글주소  수정/삭제  댓글쓰기

    좋은 내용 감사합니다

    많은 도움이 되었습니다.

    내용 담아가도 될런지요?

    • crefrog 2010.04.09 10:26  댓글주소  수정/삭제

      도움이 되셨다니 다행입니다.
      내용은 마음대로 퍼가셔도 괜찮습니다.

  6. Planet 2013.12.22 09:19  댓글주소  수정/삭제  댓글쓰기

    안녕하세요! vec 파일과 관련하여 여쭙고 싶은 것이 있어 메일 드렸습니다.
    초면에 무척 조심스럽지만, 고민끝에 도움을 구합니다... 확인해 주시면 큰 도움이 될 것 같습니다.
    좋은 정보 감사드립니다.



세계 분쟁 사망자 비율 - 1400년부터의 역사

출처: War and Peace before 1945 - Max Roser 트위터에서 흥미로운 그래프가 리트윗되어서, 블로그에도 소개글을 씁니다. 이 그래프는 1400년 이후, 세계에서 일어난 각종 무력 분쟁에서 희생당한 사..

<정보는 아름답다>, 풍성한 인포그래픽 사례집

올해 초 데이비드 맥캔들리스의 책, <정보는 아름답다>가 국내에 번역 출간되었습니다. 데이비드 맥캔들리스는 저널리스트이자 인포그래픽 디자이너로 유명한 사람입니다. 그의 TED 강연은 한번 들어볼만한 가치가 있지요. 이 책도 ..

꽃 이름 찾기 - 국가생물종지식정보시스템의 예

이전 글: 꽃 이름 찾기 - 정보축 선택의 중요성 바로 전에 꽃 이름 색인에 대한 글을 썼습니다. 그 글에 mwtree님이 댓글로 제보해주셨는데요. 국가생물종지식정보시스템 사이트에 훨씬 자세한 꽃 이름 색인 서비스가 있다고 합..

꽃 이름 찾기 - 정보축 선택의 중요성

최근에 꽃 도감을 한 권 구입했습니다. 길 가다가 마주치는 꽃들의 이름이 궁금했거든요. 책은 꽤 두껍습니다. 소개된 꽃도 365종이나 됩니다. 그렇다면 이 책에서 내가 본 꽃의 이름을 찾으려면 어떻게 해야할까요? 하나하나 책..

데이터 시각화 관련 책, <아름다운 시각화> 번역 출간

<Beautiful Visualization>이 <아름다운 시각화>라는 제목으로 인사이트에서 곧 번역 출간 됩니다. <Beautiful Visualzation>은 2010년에 오라일리 미디어가 출판한 데이터 시각화 관련 서적..

서울 지하철 노선도 시각화 - 크기는 중요하다

서울 지하철 2호선에서 가장 마지막이나 처음 차량을 타면, 벽면에 크게 그려져있는 지하철 노선도를 종종 보실 수 있습니다. 지도가 벽면을 가득채우기 때문에 사람 키보다도 더 큽니다. 이 노선도는 보통의 노선도와 달리, 서울..

카토그램(Cartogram) - 선거 결과 지도를 효과적으로 나타내는 방법

그제는 한국에서 19대 국회의원을 뽑는 선거일이었습니다. 많은 분들이 선거 개표방송을 보거나 관련 신문 뉴스를 보셨을텐데요. 아마도 이런 지도 - 당선자의 소속 정당별로 지역구를 색칠한 지도 - 를 한번쯤은 보셨을 겁니다. (..

바람 지도(Wind Map)

링크: http://hint.fm/wind/index.html 미국 내 풍향 및 풍속 데이터를 받아서 지도 위에 시각화한 프로젝트입니다. 사이트에 가보시면, 바람이 진짜 부는 것처럼 애니메이션으로 풍속을 표현해놓은 것을 볼 ..

98% 파이 그래프 행렬?

강남역 카페에서 찍은 사진입니다. 나무 인테리어가 '한 영역이 98%정도 되는 파이 그래프들이 나란히 있는' 모양으로 보이니 저도 중증 데이터 덕후인가 봅니다. ;;; 사진을 보면 나무 막대들이 높이가 고르지 않게 튀어나와 ..

R.I.P. Steve Jobs
R.I.P. Steve Jobs 2011.10.06

생활과 통합된 디자인과 기술이 세상을 어떻게 바꾸는지 몸소 보여준 스티브 잡스의 명복을 빕니다.