数千种组合造成的错觉……数字为何会误导我们
从生日悖论与中心极限定理看“相同得票数”争议

在仁川松岛1洞辖区内的提前投票中,Park Chandae候选人获得3030票,Yu Jeongbok候选人获得1440票。然而,在松岛2洞,两名候选人的得票数也分别精确一致为3030票和1440票。


光州·全南也发生了类似情况。在光州光山区松汀1洞,Min Hyeongbae候选人获得1401票,Lee Jeonghyeon候选人获得120票,而在全南高兴郡锦山面也出现了完全相同的数字。像这样候选人得票数完全一致、所谓“孪生投票所”的案例接连出现后,部分社交媒体上甚至出现了“从概率上看几乎不可能发生”的说法。

6月3日地方选举日当天,在首尔冠岳区首尔大学体育馆设置的计票所内,计票工作人员正在开启提前投票箱。韩联社供图

6月3日地方选举日当天,在首尔冠岳区首尔大学体育馆设置的计票所内,计票工作人员正在开启提前投票箱。韩联社供图

View original image

但统计学家的解读恰恰相反。他们认为,这些数字虽然吸引眼球,但从数学上看,是完全可能发生的巧合。


“并非0%概率……约为0.6%至0.9%”


Seogang大学经营学院教授 Lee Yundong在韩国科学技术媒体中心专家评论中解释称:“重要的不是比较任意两个地区的结果,而是计算在投票倾向和投票人数相近的地区之间,得票数一致的概率。”


例如,以松岛案例来看,如果总投票人数约为4470人,两名候选人的得票比例大致为2比1,那么结果会集中在特定区间。这意味着,并不是在几千个数字中任意出现某个值,而是相近的数字会反复出现。


Lee Yundong教授分析称:“在这种情况下,两地某位候选人的得票数完全一致的概率大约在0.6%至0.9%之间,这一数值远高于普通人凭直觉所认为的水平。”


与“生日悖论”相同的原理


首尔大学统计学系教授 Jang Woncheol以统计学中的代表性案例“生日悖论”解释了这一现象。


在100人聚集的场合中,两个人生日相同的概率,直观上看似乎非常低。但实际上,这一概率并不是接近99.9%的“不可能”,而是高到接近99%。这是因为人们通常只会想到特定两个人,而统计学会把所有可能的组合一并计算在内。


Jang Woncheol教授还以电话号码后三位为例。在100人中,有两人的电话号码后三位相同的概率,乍看之下似乎只有百万分之一。但实际上,从100人中任选两人的组合数达到4950种,因此至少存在一组号码相同者的概率约为99.3%。


松岛案例也是同样道理。人们关注的是“3030票和1440票”这一特定数字,但实际上,必须把从0票对4470票到4470票对0票的所有可能得票组合都纳入考虑。


Jang Woncheol教授解释称:“如果只针对3030票和1440票这一单一结果计算概率,并不恰当。若将所有可能的得票组合,以及规模相近的多个投票所组合一并考虑,出现相同得票数的可能性会比想象中高得多。”

6月3日地方选举日当天,首尔冠岳区首尔大学体育馆内设置的计票所里,计票工作人员正在统计有效选票。韩联社供图

6月3日地方选举日当天,首尔冠岳区首尔大学体育馆内设置的计票所里,计票工作人员正在统计有效选票。韩联社供图

View original image

数千种组合制造的“错觉”


在统计学中,比起单个事件,更会同时考虑整体情况数。


高丽大学统计学系教授 Heo Myeonghoe表示,通过计算机模拟计算两个人各自抛掷4470次硬币时正面次数完全相同的概率,结果约为0.9%。


问题在于,比对对象并非只有一组。若假定仁川的行政洞数量为137个,那么可能的洞组合多达9316种。在这样数千种组合中,部分出现相同结果,反而是自然现象。


在光州·全南,这种现象出现的可能性更大。因为特定候选人的支持率高达约90%,且邑、面、洞数量达到393个,可供比较的组合超过7万种。实际上,在光州·全南,已发现5组出现相同得票数的“孪生投票所”。


数字比事实更有冲击力


专家指出,这场争议显示的并非选举结果本身的问题,而是数据解读的问题。


Yeungnam大学教授 Park Hanu在韩国科学技术媒体中心专家评论中表示:“仅凭这是罕见现象这一点,就断定存在舞弊行为,并不是科学的做法。不能只盯着某一个特定数字,而应结合整体数据结构和语境一并审视。”


他还强调:“如果以概率之名传播的数字在缺乏计算依据的情况下扩散,可能会加剧社会不信任。因此,数据公开、专家验证以及概率计算过程的透明性都很重要。”



3030票和1440票,以及1401票和120票。乍看之下,这似乎是难以解释的巧合。但统计学家认为,这与生日悖论类似。若把单个事件单独拿出来看,确实显得极为罕见;但如果把从数千到数万种可能组合整体纳入考虑,出现相同得票数就是一种完全可能发生的概率现象。


本报道由人工智能(AI)翻译技术生成。

版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。

不容错过的热点