수천개 조합이 만든 착시…숫자는 왜 우리를 속이나
생일 역설·중심극한정리로 본 '동일 득표수' 논란

인천 송도1동 관내 사전투표에서 박찬대 후보는 3030표, 유정복 후보는 1440표를 얻었다. 그런데 송도2동에서도 두 후보의 득표수가 각각 3030표와 1440표로 정확히 일치했다.


광주·전남에서도 비슷한 일이 벌어졌다. 광주 광산구 송정1동에서 민형배 후보가 1401표, 이정현 후보가 120표를 얻었는데 전남 고흥군 금산면에서도 똑같은 숫자가 나왔다. 이처럼 후보 득표수가 완벽하게 일치하는 이른바 '쌍둥이 투표소' 사례가 잇따르면서 일부 사회관계망서비스(SNS)에서는 "확률적으로 거의 불가능한 일"이라는 주장까지 나왔다.

6·3지방선거일인 지난 3일 서울 관악구 서울대학교 체육관에 마련된 개표소에서 개표사무원들이 사전투표함을 개함하고 있다. 연합뉴스 제공

6·3지방선거일인 지난 3일 서울 관악구 서울대학교 체육관에 마련된 개표소에서 개표사무원들이 사전투표함을 개함하고 있다. 연합뉴스 제공

AD
원본보기 아이콘

하지만 통계학자들의 해석은 정반대다. 숫자는 눈길을 끌지만, 수학적으로는 충분히 발생 가능한 우연이라는 것이다.

"확률 0% 아니다…0.6~0.9% 수준"


이윤동 서강대 경영대학 교수는 한국과학기술미디어센터(SMCK) 전문가 논평에서 "중요한 것은 아무 두 지역의 결과를 비교하는 것이 아니라 투표 성향과 투표자 수가 비슷한 지역들 사이에서 득표수가 일치할 확률을 계산하는 것"이라고 설명했다.


예를 들어 송도 사례처럼 총투표자가 약 4470명이고 두 후보의 득표율이 대략 2대 1 수준이라면 결과는 특정 구간에 집중된다. 수천 개 숫자 가운데 아무 값이나 나오는 것이 아니라 비슷한 숫자들이 반복적으로 나타난다는 뜻이다.

이 교수는 "이 경우 두 지역에서 특정 후보의 득표수가 정확히 일치할 확률은 대략 0.6~0.9% 수준"이라며 "일반인이 직관적으로 생각하는 것보다 훨씬 높은 값"이라고 분석했다.


생일 역설과 같은 원리


장원철 서울대 통계학과 교수는 이번 현상을 통계학의 대표 사례인 '생일 역설(Birthday Paradox)'로 설명했다.


100명이 모인 자리에서 두 사람의 생일이 같을 확률은 직관적으로 매우 낮아 보인다. 하지만 실제로는 99.9%가 아니라 약 99%에 가까울 정도로 높다. 사람들은 특정 두 사람만 떠올리지만 통계에서는 가능한 모든 조합을 함께 계산하기 때문이다.


장 교수는 전화번호 끝 세 자리를 예로 들었다. 100명의 사람 가운데 두 명의 전화번호 끝 세 자리가 같을 확률은 얼핏 백만분의 1처럼 보인다. 그러나 실제로는 100명 중 두 사람을 뽑는 경우의 수가 4950개에 달해 같은 번호를 가진 사람이 한 쌍 이상 존재할 확률이 약 99.3%에 이른다.


송도 사례도 마찬가지다. 사람들은 '3030표와 1440표'라는 특정 숫자에 주목하지만, 실제로는 0표 대 4470표부터 4470표 대 0표까지 모든 가능한 득표 조합을 고려해야 한다.


장 교수는 "3030표와 1440표라는 특정 결과 하나만 놓고 확률을 계산하는 것은 적절하지 않다"며 "가능한 모든 득표 조합과 비슷한 규모의 여러 투표소 조합까지 함께 고려하면 동일한 득표수가 나타날 가능성은 생각보다 훨씬 높아진다"고 설명했다.

6·3지방선거일인 지난 3일 서울 관악구 서울대학교 체육관에 마련된 개표소에서 개표사무원이 유효 투표를 집계하고 있다. 연합뉴스 제공

6·3지방선거일인 지난 3일 서울 관악구 서울대학교 체육관에 마련된 개표소에서 개표사무원이 유효 투표를 집계하고 있다. 연합뉴스 제공

원본보기 아이콘

수천 개 조합이 만드는 '착시'


통계학에서는 개별 사건보다 전체 경우의 수를 함께 고려한다.


허명회 고려대 통계학과 교수는 두 사람이 각각 4470번 동전을 던졌을 때 앞면 수가 완전히 같을 확률을 컴퓨터 시뮬레이션으로 계산한 결과 약 0.9%가 나왔다고 설명했다.


문제는 비교 대상이 한 쌍이 아니라는 점이다. 인천의 행정동 수를 137개로 가정하면 가능한 동 조합은 9316개에 달한다. 이처럼 수천 개 조합 가운데 일부가 동일한 결과를 보이는 것은 오히려 자연스러운 현상이다.


광주·전남은 이런 현상이 나타날 가능성이 더 크다. 특정 후보 지지율이 90% 안팎으로 높고 읍·면·동 수가 393개에 달해 비교 가능한 조합이 7만 개를 넘기 때문이다. 실제로 광주·전남에서는 동일 득표수가 나타난 '쌍둥이 투표소'가 다섯 쌍 발견됐다.


숫자는 사실보다 강하다


전문가들은 이번 논란이 선거 결과보다 데이터 해석의 문제를 보여주는 사례라고 지적한다.


박한우 영남대 교수는 한국과학기술미디어센터(SMCK) 전문가 논평에서 "희귀한 현상이라는 사실만으로 부정행위를 단정하는 것은 과학적 접근이 아니다"라며 "특정 숫자 하나가 아니라 전체 데이터 구조와 맥락을 함께 살펴봐야 한다"고 말했다.


그는 또 "확률이라는 이름의 숫자가 산출 근거 없이 확산될 경우 사회적 불신을 키울 수 있다"며 "데이터 공개와 전문가 검증, 확률 계산 과정의 투명성이 중요하다"고 강조했다.

AD

3030표와 1440표, 그리고 1401표와 120표. 얼핏 보면 설명하기 어려운 우연처럼 보인다. 하지만 통계학자들은 이를 생일 역설과 유사한 현상으로 본다. 개별 사건만 떼어 놓고 보면 매우 드물어 보이지만, 수천에서 수만 개에 이르는 가능한 조합 전체를 고려하면 동일한 득표수가 나타나는 것은 충분히 발생 가능한 확률 현상이라는 설명이다.


김종화 기자 justin@asiae.co.kr

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 보면 좋은 기사

새로보기

내 안의 인사이트 깨우기

취향저격 맞춤뉴스

많이 본 뉴스

당신을 위한 추천 콘텐츠

놓칠 수 없는 이슈