오늘은 pajek에서 사용하는 "Partition"과 "Vector" 데이터 파일 형식을 알아보겠습니다.
pajek에서는 기본적인 Network(.net) 파일 외에도 Partition, Vector, Permutation, Cluster, Hierarchy 파일 형식이 존재합니다. 이 파일 형식들은 Network 데이터의 메타데이터(meta-data)역할을 합니다. 즉, 네트워크를 설명하는 데이터란 거죠.
위 실행창에서 왼쪽에 Networks 밑으로 Partition등이 보이죠? 여기에 데이터 파일을 등록해서 사용할 수 있습니다.
우선 테스트를 위해 랜덤 네트워크를 만들어 봅시다. 다음 메뉴를 클릭하면 간단한 랜덤 네트워크를 생성할 수 있습니다.
점(vertice)의 갯수와 연결선(arc)의 갯수를 물어보는데 각각 5와 10을 입력합시다. 그러면 점이 5개고 연결선이 10개인 랜덤 네트워크가 생성됩니다. 다음 메뉴를 클릭하면 만들어진 네트워크를 확인할 수 있습니다.
여기까지는 전에도 해본 것이니 어렵지 않을 겁니다. 그러면 이제 Partition을 만들어봅시다.
위 명령은 노드(점)에 들어오는 방향으로 연결된 링크(연결선)의 숫자에 따라 노드를 파티션(Partition)으로 분류하라는 뜻입니다. (Net> Partitions 밑에 수많은 명령이 있는데 기능은 나중에 설명하도록 하겠습니다.) 위 메뉴를 누르고 나면 기본 창에 Partitions와 Vectors 항목에 새 파일이 생긴 것을 확인할 수 있습니다.
이제 왼쪽 디스켓 아이콘을 클릭해서 데이터 파일을 각각 저장해봅시다.
Netwokr 파일의 기본 확장자는 .net, Partition 파일은 .clu, Vector 파일은 .vec입니다. 이제 하나씩 확인해볼까요?
.net 파일 (Network)
1 "v1" 0.1000 0.5000 0.5000
2 "v2" 0.3764 0.1196 0.5000
3 "v3" 0.8236 0.2649 0.5000
4 "v4" 0.8236 0.7351 0.5000
5 "v5" 0.3764 0.8804 0.5000
*Arcs
2 1 1
5 1 1
1 2 1
4 1 1
2 3 1
2 4 1
5 3 1
1 3 1
3 4 1
1 4 1
.net 파일은 예전에 설명했으니 자세히 설명하지 않겠습니다. 단, 여기서 노드 뒤에 숫자 세개는 네트워크 그림을 그릴때 노드가 그려질 위치입니다. 저 숫자는 레이아웃을 바꿀때마다 계속 바뀌니 신경 안 쓰셔도 됩니다.
.clu 파일 (Partition)
3
1
3
3
0
Partition 파일은 무척 단순합니다. 숫자의 순서는 노드의 순서를 뜻합니다. 즉, 첫번째 노드는 3, 두번째 노드는 1이란 뜻이죠. 그리고 같은 숫자는 해당 노드가 같은 Partition에 속한다는 뜻입니다. 위 파일대로라면 노드가 {v1, v3, v4}, {v2}, {v5} 세 그룹으로 분류된다는 뜻이죠.
.vec 파일 (Vector)
0.75000000000000000
0.25000000000000000
0.75000000000000000
0.75000000000000000
0.00000000000000000
Vector 파일도 Partition 파일과 마찬가지 형식입니다. 단, Vector는 분류 정보가 아닌 임의의 어떤 정보를 담고 있다는 점이 다르죠. 여기서는 (들어오는 방향의 연결선 수)/(총 가능한 들어오는 방향의 연결수)를 뜻합니다. 노드가 총 5개니, 들어오는 링크는 최대 4개까지 가능하죠. 따라서 첫번째 값은 3/4=0.75가 됩니다.
꼭 이런 값 말고도 다른 의미의 값을 줄 수도 있습니다. 예를 들어 "v1 노드에 해당하는 사람이 어떤 일을 할 확률이 0.5이다"라고 하면 그냥 Vector 파일에서 해당하는 칸에 0.5라고 써줄 수도 있습니다. (정보에 일관성만 있으면 됩니다.)
자, 이제 위 데이터 파일을 이용해서 네트워크를 그려봅시다.
아래 메뉴를 누르면 네트워크 그림에 Partition과 Vector 정보를 추가할 수 있습니다.
차이점이 보이시나요?
노드의 색과 크기가 변했는데, 이는 각각 Partition과 Vector의 정보를 이용한 것입니다.
아까 {v1, v3, v4}, {v2}, {v5} 로 분류되었다고 했는데, v1,v3,v4의 색이 빨간 색으로 같은 것을 볼 수 있습니다. v2는 다른 파티션이라 노란색이죠. v5는 점의 크기가 0이라서 보이진 않지만, 크기를 키우면 역시 빨간색도 노란색도 아닌 다른 색으로 되어있을 겁니다.
노드의 크기는 Vector에서 0.75, 0.25... 등의 값에 비례하게 그려져있습니다.
이제 .clu파일과 .vec 파일을 조작하면 어떤 식으로 네트워크가 그려질지 감이 오셨을 겁니다.
'시각화 도구 설명서' 카테고리의 다른 글
Excel로 네트워크를 그리자 - NodeXL (2) | 2010.06.16 |
---|---|
[pajek] 6. Permuation 파일을 이용한 인접행렬표현 (2) | 2010.04.09 |
[pajek] 5. Partition, Vector 파일 (10) | 2009.05.09 |
[pajek] 4. .net 파일 구조 (5) | 2008.05.29 |
[pajek] 3. 가중치 있는 네트워크weighted network 그리기 (4) | 2008.05.26 |
[pajek] 2. 엑셀 및 텍스트 파일을 이용해 간단한 네트워크 그리기 (5) | 2008.05.26 |
댓글을 달아 주세요
pajek 입문자입니다..
글 감사히 보고 있습니다..^^
블로그 방문해주셔서 감사합니다.
한가지 질문이 있습니다..
도형의 경우에는 비트맵으로 내보낼수가 있어서, 이용하기 쉬운(?) 프로그램에서 볼 수 있는데,
메뉴얼을 보니, File > Network > Export Matrix to EPS를 통해서 데이터셋을 그림으로 익스포트를 할 수가 있게 되어
있는 것 같습니다..일단 이게 맞나요?..ㅡ.ㅡㅋ
근데 eps로만 내보내져서, 열려고 하니 포토샵에서 인식을 못하더라고요..
이것저것 참고해 보니, 일러에서 열어야 한다 그러는디, 제가 일러가 없어서,
혹시 일러말고 다른 프로그램에서 열어볼 수 있나요?..아니면 일러에서만 볼 수 있나요?..
궁금증 좀 해결해주세요..-0-
그 옵션은 행렬을 eps 포맷으로 그려주는 옵션입니다. (네트워크가 아닙니다.) eps 형식은 postscript를 지원하는 프로그램(예: ghostview)에서 열수 있을 겁니다.
네트워크를 그리고 싶으시다면, draw창에서 (draw 메뉴를 선택했을때 새로 뜨는 창)에서 Export 메뉴를 선택하시면 됩니다. 여기에 bmp로 그림을 저장할 수 있는 옵션이 있습니다.
아..더 찾아보니 gsview라는게 있네요..;;
열어보니 포토샵에서 깨져서 나오는 줄 알았는데, 그게 아니었네요..;;
바둑판 형태로 그림이 나오면서 라벨들이 붙는데, 그게 한글들이어서 깨지는게 아닐까 하는 생각만 듭니다..ㅡ.ㅡ
네..제가 필요한게 네트워크 연결도랑 입력자료들의 데이타셋(매트릭스 형태)가 필요했었는데, 아래 적은 것처럼
vertice 네임들이 깨져서 나오네요..
엑셀에서 데이터셋(한글로 입력)을 만들고 exceltopajek으로 *.net 파일 만들고 했는데,
네트워크도는 한글이 제대로 나오는데, 위의 행렬을 eps로 보냈더니, 한글이 깨져 나오네요..
예전에 grapher에서도 그랬던 적이 있었는데, 그 떄는 엑셀에서 파일 형식을 달리 해서 grapher에서 받았더니,
(95로 저장을 했었나...)
한글이 제대로 나왔던 기억이 있어, 그렇게 한번 해볼까 합니다..그래도 안 나오면 좌절모드로..-0-
인코딩 바꿔가면서 해봐도 잘 안되는 걸 보니, eps 만들때 사용하는 글꼴 파일 문제인 것 같습니다. 아마 해결이 안될 것 같네요;
좋은 내용 감사합니다
많은 도움이 되었습니다.
내용 담아가도 될런지요?
도움이 되셨다니 다행입니다.
내용은 마음대로 퍼가셔도 괜찮습니다.
안녕하세요! vec 파일과 관련하여 여쭙고 싶은 것이 있어 메일 드렸습니다.
초면에 무척 조심스럽지만, 고민끝에 도움을 구합니다... 확인해 주시면 큰 도움이 될 것 같습니다.
좋은 정보 감사드립니다.