본문 바로가기

정보시각화 소식

랜덤 워크(Random walk) - 랜덤(Randomness)은 어떻게 생겼을까?

블로깅을 하다가 재미있는 프로젝트 사이트를 발견했습니다. RANDOM WALK라는 사이트인데요. "랜덤은 어떻게 생겼을까?"라는 질문을 던지며, 랜덤한 숫자를 이용한 다양한 물리학 및 수학 실험을 시각화하고 있습니다. 

----

랜덤(Randomness)이란 우리말로는 '무작위' 또는 '마구잡이' 정도로 번역됩니다. 간단히 말하자면, 주사위를 던져서 나오는 숫자와 같이 예측할 수 없는 숫자를 랜덤한 숫자라고 합니다. 그리고 여러번 주사위를 던지는 경우를 일컬어 '랜덤한 과정(random process)'이라고 하죠.

우리는 다음에 나올 랜덤한 숫자를 정확히 예측할 수 없습니다. 하지만 랜덤한 과정을 거친다면, 대략적으로 예측은 가능하죠. 예를들어 주사위를 한번 던질 때 그 눈의 값이 뭐가 나올지는 정확히 모르지만, 여러번 던지다보면 같은 숫자가 1/6 정도 비율로 나온다는 사실은 알 수 있죠.

이렇듯 "랜덤"은 혼돈과 규칙을 동시에 포함하고 있는 개념입니다.

----

RANDOM WALK에는 다양한 랜덤 워크 시각화 실험이 올라와있는데, 이 중에 몇개만 뽑아서 간단히 설명드리겠습니다.

1. 정규 분포(normal distribution) 실험
정규 분포는 정말로 흔하게 접할 수 있는 분포입니다. 사람들 키나 몸무게, IQ 등이 이 분포를 따르죠. 사람들 키를 조사해보면 키가 평균인 사람이 가장 많고, 키가 큰 쪽이나 작은 쪽으로 갈 수록 사람 수가 점점 적어지는 것을 볼 수 있습니다. 이를 그래프로 그리면 다음과 같은 형태를 띱니다.


아래 그림은 랜덤한 과정을 통해 정규 분포를 만드는 실험입니다.
 

정규 분포 실험

정규 분포 실험


이 실험은 빠찡코를 연상하시면 됩니다. 쇠구슬을 맨 위에서 아래로 떨어뜨린다고 생각해봅시다. 굴러 내려오는 길에는 못(회색 점)을 같은 간격으로 박아놓았고요. (쇠구슬이 못을 만났을 때 왼쪽이나 오른쪽으로 갈 확률은 똑같습니다.) 쇠구슬을 여러번 떨어뜨리면 맨 밑에 도착할 때까지 다양한 경로가 나옵니다. 위 그림은 바로 이 경로를 그려놓은 것입니다. 쇠구슬이 많이 지나간 경로일 수록 두꺼운 선으로 표시했죠.

쇠구슬을 여러번 굴리고, 최종적으로 쇠구슬이 어느 지점에 떨어졌는지를 세어보면 두번째 그림 아래 숫자와 같이 나옵니다. 이 숫자가 바로 정규 분포를 따르게 됩니다.
 

2. 몬테 카를로(Monte Carlo) 방법
 
몬테 카를로 방법은 도박으로 유명한 모나코의 몬테 카를로(Monte Carlo)에서 이름을 따온 방법입니다. 흔히 해석적으로, 즉 수학적으로 딱 떨어지게 답을 구할 수 없는 문제를 풀 때 쓰는 방법이죠.

몬테 카를로 방법


예를 들어 위 그림에서 A라는 글자의 넓이를 구하는 경우를 생각해봅시다. 원의 넓이야 공식으로 구하면 되겠지만, A의 넓이를 수학식으로 풀어내기는 상당히 어렵겠죠. 

몬테 카를로 방법에서는 수식을 사용하는 대신, 랜덤한 숫자를 이용합니다. 원 안에 무작위로 점을 찍는다고 생각해보죠. 이 점은 A라는 글자 안에 찍힐 수도, 밖에 찍힐 수도 있습니다. 점을 아주 많이 찍을 경우, A안에 찍히는 점의 숫자는 A의 넓이에 비례하게 되겠죠? 따라서 원의 넓이 * (A안에 찍힌 점의 숫자)/(전체 점의 숫자)를 구해보면 A의 넓이를 대략적으로 알 수 있게 됩니다. 점의 숫자를 늘리면 소숫점 몇째자리 수준의 아주 정확한 값을 구할 수 있습니다.

위 그림에서는 A에 찍힌 점과 밖에 찍힌 점의 색깔을 달리해서, 몬테 카를로 방법의 원리를 직관적으로 보여주고 있습니다. 위 수치대로 하면, A의 넓이는 원의 넓이 * 0.35가 되겠네요.



3. 벤포드 법칙(Benford's law)

벤포드 법칙


랜덤한 숫자에는 벤포드 법칙(Benford's law)이라는 신기한 규칙이 있습니다. 랜덤한 숫자열 맨 앞 숫자(1,2,3...,9)가 나타나는 빈도를 조사해보면 일정한 분포를 따른다는 법칙이죠.

예를 들어 위 그림처럼, 각 나라의 넓이 값을 나타내는 숫자를 조사한다고 해보죠.(위에서 두번째 그림) 아프가니스탄은 647,500 평방 킬로미터니, 맨 앞 숫자는 6이 됩니다. 이런 식으로 모든 숫자를 조사해서 그 비율을 따져보면, 숫자 1은 30.1%, 2는 17.6%, 3은 12.5% 정도 나오게 됩니다. (1이 가장 많이 나오고, 9가 가장 적게 나오죠. 위 그림에서도 비슷한 비율이 나왔네요)

벤포드 법칙의 놀라운 점은, 랜덤한 숫자라면 항상 적용이 된다는 것입니다.  일상 생활에서 접할 수 있는 랜덤한 숫자에서 넓게 관찰된다는 점입니다. 각 나라의 인구 수라든지, 가계부에 써놓은 입출금 숫자 등에도 보통 적용이 되죠. 시간이 많으신 분은 랜덤한 숫자를 하나 골라서 한번 실험해보셔도 좋겠습니다. :)

---------
랜덤이라는 개념은 말만으로는 쉽게 이해하기 힘든데, 이렇게 시각화해서 보면 좀 더 잘 이해가 될 것 같네요. 뭐가 뭔지 더 헷갈리는 면도 좀 있긴 합니다만...^^;;

RANDOM WALK 사이트에는 이외에도 시각화 그림이 많이 있습니다. 관심있는 분들은 방문하셔서 찬찬히 살펴보시는 것도 좋겠네요.

이 작품들을 만든 분은 Daniel A. Becker라고 합니다. 이것 역시 시각화 스크립트 도구인 Processing을 이용해서 만들었다고 하네요.
 

바로가기:
http://www.random-walk.com/index_en.htm