Monday, June 27, 2016

로또 당첨 번호 예측의 오류

(2016년 1월)

전에 서울에 방문했을 때,
그 당시 1등이 17번 나왔다는 상계동의 어떤 가게에
사람들이 매우 긴 줄을 만들어 서있는 것을 보고 놀란 적이 있는데,
뉴스를 보니 그곳은 '로또 명당'으로 소문난 판매점으로
2012년에 총168억원어치의 로또복권을 팔아
판매수수료로 8억4376만원을 벌었다고 한다.
이 정도면, 거기서 로또를 사는 사람들보다
그 가게가 로또에 맞은 것이라고도 할 수 있을 것이다.

'로또 명당'이라는 것이 전혀 근거가 없음에도 불구하고
믿는 사람들이 상당히 많은데,
이런 곳은 유명해져서 매우 많은 사람들이 로또를 구입하므로
거기에서 당첨자가 나올 확률이 높아졌을 뿐
내가 산 하나의 로또가 당첨될 확률이 높아지는 것이 아니다.

예를 들어서, A라는 가게에서는 100만장의 로또가 팔렸고
B라는 가게에서는 1만장의 로또가 팔렸다면
당연히 A 가게에서 1등 당첨자가 나올 확률이 B 가게의 경우보다 훨씬 크게 된다.
그렇다고 해서, 내가 A 가게에서 산 로또 1장이 당첨될 확률이 커지는 것은 아니다.

두 가게를 비교하려면, 두 가게에서 팔린 로또의 갯수가 똑같아야 한다.
또는 당첨자 수에서 판매된 갯수를 나눠서 비교를 해야 한다.
만약 두 가게 모두 1년 동안 똑같이 각각 50만장씩 팔렸는데
1등 당첨자가 A 가게에서는 10명이 나왔고 B 가게에서는 1명이 나왔다면
뭔가 진짜 차이가 있을지도 모른다.
하지만, 3명 대 1명 정도의 차이라면 별 의미가 없다고 생각한다.

또한, 인테넷에 찾아보니
로또 당첨 번호의 통계 분석을 통해
다음 당첨 번호를 예측하는 서비스가 꽤 많아 보인다.
생소한 용어를 써가며 과학적 분석이라고 광고하는데
이런 서비스를 이용하는 사람들이 상당히 많은 것 같다.
실제로 이런 website가 인기 website 순위에서 상당히 높은 등수로 나온다고 한다.

이것은 로또 당첨 번호의 선정이 랜덤 독립사건이기 때문에
의미가 없는 것이라는 것을 쉽게 알 수 있을텐데도
사람들이 이런 것에 혹하기 쉬운가 보다.

몇일전 본 기사에, 실제 1등에 당첨된 번호들을 분석해보면
자주 발생하는 번호 패턴이 다음과 같다고 한다.

- 6개 당첨 번호 합계 범위
    121-150: 37.27%
    151-180: 26.5%
     91-120: 19.67%
    (31-60, 211-240: 매우 적음)

- 홀수:짝수 갯수
    3:3 = 34.1%
    4:2 = 25.73%
    2:4 = 23.85%
    (6:0, 0:6 = 거의 없음)

그러므로, 가능성이 높은 번호 조합인
6개 당첨 번호 합계가 121-150 이고
홀수/짝수 갯수가 각각 3개인 번호 조합을 선택하면
당첨확률이 높아진다는 것이다.
(물론 이외에도 여러가지 다른 통계 조합과 규칙을 적용함.)

하지만, 이런 주장에는 중요한 함정이 있다.
먼저 이해하기 쉬운 간단한 경우를 살펴보면...

만약 1-100 중에서 랜덤하게 하나의 당첨 번호를 고르는 경우,
1-10 구간과 11-100 구간을 비교한다면
당연히 11-100 구간이 더 넓으므로 이 구간에서 더 자주 당첨 번호가 나온다.
그렇다고 해서, 11-100 사이의 번호를 하나 선택하면
1-10 사이의 번호를 하나 선택할 때보다 당첨이 잘 되는 것은 아니다.

즉, 지난 당첨 번호들이 11-100 구간에서 많이 나왔다고 해서
그 구간의 번호를 선택하면 당첨 확률이 높다는 것은
전혀 말이 되지 않는다는 것을 쉽게 알 수 있으리라고 생각한다.

위에서 각 구간의 크기를 30으로 같게 해도
번호의 합이 121-150인 경우가 31-60인 경우보다 훨씬 자주 나온다는데...?

이것은 각 구간의 크기가 같더라도
각 구간별로 가능한 번호 조합의 갯수가 다르기 때문에
(합이 121-150이 되는 번호 조합의 갯수가 31-60이 되는 것보다 훨씬 많음)
결과적으로 위의 1-10와 11-100의 비교와 마찬가지라고 할 수 있다.


홀수:짝수 갯수에 대해서, 예를 들어,
동전을 4번 던져서 앞뒤가 나오거나
주사위를 던져서 홀수/짝수가 나오는 경우
이를 4번 시행하면, 가능한 모든 경우의 수는 다음과 같이 16가지가 된다.
(0: 짝수 또는 뒷면,  1: 홀수 또는 앞면)

0 0 0 0
0 0 0 1
0 0 1 0
0 0 1 1
0 1 0 0
0 1 0 1
0 1 1 0
0 1 1 1
1 0 0 0
1 0 0 1
1 0 1 0
1 0 1 1
1 1 0 0
1 1 0 1
1 1 1 0
1 1 1 1

위에 리스트한 16가지 경우는 각각 모두 똑같은 확률 (= 1/16)을 가지고 있어서
'0 0 0 0'이 일어날 확률이나 '0 1 1 0'이 일어날 확률은 같다.

여기에서 홀수:짝수 갯수를 비교해 보면
2:2 = 6번
1:3 = 4번
3:1 = 4번
0:4 = 1번
4:0 = 1번

즉, 이론적으로 홀수:짝수 갯수가 2:2일 확률은 6/16 이고
짝수만 4번 나오는 '0:4' 경우의 확률은 1/16 이다.

이렇게 이론적으로만 보지 말고 실제로 이것을 여러번 실행해 봐도
홀수:짝수 비율이 '2:2'의 경우가 '0:4'의 경우보다
약 6배 정도 자주 발생하는 것을 볼 수 있다.
(물론 아주 많이 시행하지 않으면 약간의 차이가 있을 수 있음.)

그러므로, 이런 패턴에 맞춰서 '0 1 1 0'을 선택하면
'0 0 0 0'을 선택하는 것보다 당첨확률이 높게 될까?

그렇지 않다.
이것은 11-100의 구간이 넓어서 당첨 번호가 많이 나오는 것과 마찬가지로
홀짝 2:2인 경우의 수가 많아서 그렇게 나타나는 것일 뿐
'0 0 0 0'과 '0 1 1 0'이 일어날 확률은 각각 1/16으로 똑같다.
(즉, 확률이 각각 1/16과 6/16이 아니다.)

이 예에서, 홀수:짝수 비율이 2:2의 경우가 더 자주 발생하긴 하지만
내가 그 중에 한 번호를 선택할 때는
홀수:짝수 비율이 2:2인 6가지 경우 중에서 하나를 선택하는 것이기 때문에
실제로 내가 선택한 번호가 당첨될 확률은

(홀짝 2:2인 번호가 당첨될 확률)*(그런 번호 중에서 내 번호가 당첨될 확률)
                      = (6/16)*(1/6) = 1/16  로서

모두 짝수인 '0 0 0 0'을 선택한 경우와 마찬가지가 된다.

홀수:짝수 비율이 2:2인 경우가 많이 발생하면 무슨 소용이 있나
그 중에서 내가 선택한 하나의 번호가 당첨될 확률은 마찬가지인데...

어떤 번호 조합 패턴의 확률이 높다고 주장하지만
그것은 단지 그런 패턴에 해당하는 경우의 수가 많기 때문일 뿐이고
본인이 그 중에서 실제로 선택한 번호의 당첨확률이 높은 것은 아니다.

결국 당첨 번호를 예측한다는 사람들은
감춰진 규칙성을 찾는 것이 아니라
번호 패턴들을 이런 저런 다른 크기의 그룹으로 나누어 놓고
큰 그룹에 있는 번호를 선택하면 당첨 확률이 높아진다고 주장하는 것인데,
이렇게 그룹의 당첨 확률과 본인이 실제로 선택한 개별 번호의 당첨 확률의 차이를
구별하지 못하는 사람들이 상당히 많은 것 같다.

아니, 많은 사람들은 합리적 근거에 따라 판단하기 보다는
자기가 믿고 싶은 것을 믿는 것 같다.

* http://www.ddanzi.com/index.php?mid=ddanziNews&document_srl=948965
[비결] 로또 맞는 비결을 까발려주마

No comments: