태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

블로깅을 하다가 재미있는 프로젝트 사이트를 발견했습니다. RANDOM WALK라는 사이트인데요. "랜덤은 어떻게 생겼을까?"라는 질문을 던지며, 랜덤한 숫자를 이용한 다양한 물리학 및 수학 실험을 시각화하고 있습니다. 

----

랜덤(Randomness)이란 우리말로는 '무작위' 또는 '마구잡이' 정도로 번역됩니다. 간단히 말하자면, 주사위를 던져서 나오는 숫자와 같이 예측할 수 없는 숫자를 랜덤한 숫자라고 합니다. 그리고 여러번 주사위를 던지는 경우를 일컬어 '랜덤한 과정(random process)'이라고 하죠.

우리는 다음에 나올 랜덤한 숫자를 정확히 예측할 수 없습니다. 하지만 랜덤한 과정을 거친다면, 대략적으로 예측은 가능하죠. 예를들어 주사위를 한번 던질 때 그 눈의 값이 뭐가 나올지는 정확히 모르지만, 여러번 던지다보면 같은 숫자가 1/6 정도 비율로 나온다는 사실은 알 수 있죠.

이렇듯 "랜덤"은 혼돈과 규칙을 동시에 포함하고 있는 개념입니다.

----

RANDOM WALK에는 다양한 랜덤 워크 시각화 실험이 올라와있는데, 이 중에 몇개만 뽑아서 간단히 설명드리겠습니다.

1. 정규 분포(normal distribution) 실험
정규 분포는 정말로 흔하게 접할 수 있는 분포입니다. 사람들 키나 몸무게, IQ 등이 이 분포를 따르죠. 사람들 키를 조사해보면 키가 평균인 사람이 가장 많고, 키가 큰 쪽이나 작은 쪽으로 갈 수록 사람 수가 점점 적어지는 것을 볼 수 있습니다. 이를 그래프로 그리면 다음과 같은 형태를 띱니다.


아래 그림은 랜덤한 과정을 통해 정규 분포를 만드는 실험입니다.
 

정규 분포 실험

정규 분포 실험


이 실험은 빠찡코를 연상하시면 됩니다. 쇠구슬을 맨 위에서 아래로 떨어뜨린다고 생각해봅시다. 굴러 내려오는 길에는 못(회색 점)을 같은 간격으로 박아놓았고요. (쇠구슬이 못을 만났을 때 왼쪽이나 오른쪽으로 갈 확률은 똑같습니다.) 쇠구슬을 여러번 떨어뜨리면 맨 밑에 도착할 때까지 다양한 경로가 나옵니다. 위 그림은 바로 이 경로를 그려놓은 것입니다. 쇠구슬이 많이 지나간 경로일 수록 두꺼운 선으로 표시했죠.

쇠구슬을 여러번 굴리고, 최종적으로 쇠구슬이 어느 지점에 떨어졌는지를 세어보면 두번째 그림 아래 숫자와 같이 나옵니다. 이 숫자가 바로 정규 분포를 따르게 됩니다.
 

2. 몬테 카를로(Monte Carlo) 방법
 
몬테 카를로 방법은 도박으로 유명한 모나코의 몬테 카를로(Monte Carlo)에서 이름을 따온 방법입니다. 흔히 해석적으로, 즉 수학적으로 딱 떨어지게 답을 구할 수 없는 문제를 풀 때 쓰는 방법이죠.

몬테 카를로 방법


예를 들어 위 그림에서 A라는 글자의 넓이를 구하는 경우를 생각해봅시다. 원의 넓이야 공식으로 구하면 되겠지만, A의 넓이를 수학식으로 풀어내기는 상당히 어렵겠죠. 

몬테 카를로 방법에서는 수식을 사용하는 대신, 랜덤한 숫자를 이용합니다. 원 안에 무작위로 점을 찍는다고 생각해보죠. 이 점은 A라는 글자 안에 찍힐 수도, 밖에 찍힐 수도 있습니다. 점을 아주 많이 찍을 경우, A안에 찍히는 점의 숫자는 A의 넓이에 비례하게 되겠죠? 따라서 원의 넓이 * (A안에 찍힌 점의 숫자)/(전체 점의 숫자)를 구해보면 A의 넓이를 대략적으로 알 수 있게 됩니다. 점의 숫자를 늘리면 소숫점 몇째자리 수준의 아주 정확한 값을 구할 수 있습니다.

위 그림에서는 A에 찍힌 점과 밖에 찍힌 점의 색깔을 달리해서, 몬테 카를로 방법의 원리를 직관적으로 보여주고 있습니다. 위 수치대로 하면, A의 넓이는 원의 넓이 * 0.35가 되겠네요.



3. 벤포드 법칙(Benford's law)

벤포드 법칙


랜덤한 숫자에는 벤포드 법칙(Benford's law)이라는 신기한 규칙이 있습니다. 랜덤한 숫자열 맨 앞 숫자(1,2,3...,9)가 나타나는 빈도를 조사해보면 일정한 분포를 따른다는 법칙이죠.

예를 들어 위 그림처럼, 각 나라의 넓이 값을 나타내는 숫자를 조사한다고 해보죠.(위에서 두번째 그림) 아프가니스탄은 647,500 평방 킬로미터니, 맨 앞 숫자는 6이 됩니다. 이런 식으로 모든 숫자를 조사해서 그 비율을 따져보면, 숫자 1은 30.1%, 2는 17.6%, 3은 12.5% 정도 나오게 됩니다. (1이 가장 많이 나오고, 9가 가장 적게 나오죠. 위 그림에서도 비슷한 비율이 나왔네요)

벤포드 법칙의 놀라운 점은, 랜덤한 숫자라면 항상 적용이 된다는 것입니다.  일상 생활에서 접할 수 있는 랜덤한 숫자에서 넓게 관찰된다는 점입니다. 각 나라의 인구 수라든지, 가계부에 써놓은 입출금 숫자 등에도 보통 적용이 되죠. 시간이 많으신 분은 랜덤한 숫자를 하나 골라서 한번 실험해보셔도 좋겠습니다. :)

---------
랜덤이라는 개념은 말만으로는 쉽게 이해하기 힘든데, 이렇게 시각화해서 보면 좀 더 잘 이해가 될 것 같네요. 뭐가 뭔지 더 헷갈리는 면도 좀 있긴 합니다만...^^;;

RANDOM WALK 사이트에는 이외에도 시각화 그림이 많이 있습니다. 관심있는 분들은 방문하셔서 찬찬히 살펴보시는 것도 좋겠네요.

이 작품들을 만든 분은 Daniel A. Becker라고 합니다. 이것 역시 시각화 스크립트 도구인 Processing을 이용해서 만들었다고 하네요.
 

바로가기:
http://www.random-walk.com/index_en.htm


Posted by crefrog

댓글을 달아 주세요

  1. 라임에이드 2009.06.02 01:08  댓글주소  수정/삭제  댓글쓰기

    쩝... 벤포드 법칙에 대한 위키피디아 다시 잘 읽어보시기 바랍니다. 통계 같은 실생활의 숫자에서 대부분 나타난다라고 말하고 있고, 모두 그런 것은 아니라고 특별히 강조까지 하고 있죠...제 생각엔 어떤 '양'을 나타내는 숫자일 때만 나타나는게 아닌가 싶습니다.

    • crefrog 2009.06.02 07:48 신고  댓글주소  수정/삭제

      제가 잘못된 표현으로 쓴 것 같군요. 수정했습니다.
      로그의 성질에 관련된 법칙이라, 왠만하면 적용되는 경우가 많아서 너무 강한 표현을 쓴 것 같네요. 감사합니다.



세계 분쟁 사망자 비율 - 1400년부터의 역사

출처: War and Peace before 1945 - Max Roser 트위터에서 흥미로운 그래프가 리트윗되어서, 블로그에도 소개글을 씁니다. 이 그래프는 1400년 이후, 세계에서 일어난 각종 무력 분쟁에서 희생당한 사..

<정보는 아름답다>, 풍성한 인포그래픽 사례집

올해 초 데이비드 맥캔들리스의 책, <정보는 아름답다>가 국내에 번역 출간되었습니다. 데이비드 맥캔들리스는 저널리스트이자 인포그래픽 디자이너로 유명한 사람입니다. 그의 TED 강연은 한번 들어볼만한 가치가 있지요. 이 책도 ..

꽃 이름 찾기 - 국가생물종지식정보시스템의 예

이전 글: 꽃 이름 찾기 - 정보축 선택의 중요성 바로 전에 꽃 이름 색인에 대한 글을 썼습니다. 그 글에 mwtree님이 댓글로 제보해주셨는데요. 국가생물종지식정보시스템 사이트에 훨씬 자세한 꽃 이름 색인 서비스가 있다고 합..

꽃 이름 찾기 - 정보축 선택의 중요성

최근에 꽃 도감을 한 권 구입했습니다. 길 가다가 마주치는 꽃들의 이름이 궁금했거든요. 책은 꽤 두껍습니다. 소개된 꽃도 365종이나 됩니다. 그렇다면 이 책에서 내가 본 꽃의 이름을 찾으려면 어떻게 해야할까요? 하나하나 책..

데이터 시각화 관련 책, <아름다운 시각화> 번역 출간

<Beautiful Visualization>이 <아름다운 시각화>라는 제목으로 인사이트에서 곧 번역 출간 됩니다. <Beautiful Visualzation>은 2010년에 오라일리 미디어가 출판한 데이터 시각화 관련 서적..

서울 지하철 노선도 시각화 - 크기는 중요하다

서울 지하철 2호선에서 가장 마지막이나 처음 차량을 타면, 벽면에 크게 그려져있는 지하철 노선도를 종종 보실 수 있습니다. 지도가 벽면을 가득채우기 때문에 사람 키보다도 더 큽니다. 이 노선도는 보통의 노선도와 달리, 서울..

카토그램(Cartogram) - 선거 결과 지도를 효과적으로 나타내는 방법

그제는 한국에서 19대 국회의원을 뽑는 선거일이었습니다. 많은 분들이 선거 개표방송을 보거나 관련 신문 뉴스를 보셨을텐데요. 아마도 이런 지도 - 당선자의 소속 정당별로 지역구를 색칠한 지도 - 를 한번쯤은 보셨을 겁니다. (..

바람 지도(Wind Map)

링크: http://hint.fm/wind/index.html 미국 내 풍향 및 풍속 데이터를 받아서 지도 위에 시각화한 프로젝트입니다. 사이트에 가보시면, 바람이 진짜 부는 것처럼 애니메이션으로 풍속을 표현해놓은 것을 볼 ..

98% 파이 그래프 행렬?

강남역 카페에서 찍은 사진입니다. 나무 인테리어가 '한 영역이 98%정도 되는 파이 그래프들이 나란히 있는' 모양으로 보이니 저도 중증 데이터 덕후인가 봅니다. ;;; 사진을 보면 나무 막대들이 높이가 고르지 않게 튀어나와 ..

R.I.P. Steve Jobs
R.I.P. Steve Jobs 2011.10.06

생활과 통합된 디자인과 기술이 세상을 어떻게 바꾸는지 몸소 보여준 스티브 잡스의 명복을 빕니다.