【蒙特卡洛采样预测】阿森纳欧冠小组赛最终排名以及16强对手会是谁

关注

今年新的欧冠规则下36支球队大乱斗,带来的结果就是即使还有一轮就结束小组赛,我们也无法判断最终排名,更别说是预测16强潜在的对手。废话不多说,今天写了一个python程序,基于每支球队在前七轮比赛中的表现制定预期进球均值,用正态分布+蒙特卡洛采样法实现了10000次最后一轮赛果的模拟,从而生成对应的最终欧冠小组赛积分榜,然后统计了阿森纳最终排名的可能性和16强遇到潜在对手的可能性,分享给大家。

以免犯困,先抛出结论:

1.阿森纳51.15%排名第三,29.5%排名第二,7.9%排名第五,0%跌出前八(图1)

2.16强最高概率的潜在对手:凯尔特人、布雷斯特、尤文、皇马、里尔、摩纳哥(图2)

以下是这次模拟方法的注解;

注1:何为蒙特卡洛采样法?给予一个概率分布,随机生成大量范围内数值,从而可视化概率事件直接或者间接导致的结果。

注2:如何预测第八轮比赛的结果?定义一个合理的概率分布是本帖的难点,也是造成预测结果偏差的最大因素,这一点请如果各位不满意尽情吐槽和出谋划策:在这次预测中,我们可以把每支球队的进球数做一个概率分布:用"log2(前七轮场均进球+对手前七轮场均失球)"作为每支球队的预期进球数(平均值),以方差为1的正态分布随机采样一个自然数,约到整数,如果小于零就归零,得到这支球队本次模拟的实际进球数。举个例子,前七轮巴萨进26球丢11球,真蓝黑进18球失4球,那么最后一轮比赛巴萨的预期进球数就是log2(26/7+4/7)=2.1,真蓝黑的预期进球数是log2(18/7+11/7)=2.05。所以在这个概率分布下,这俩队最后一场可以说是旗鼓相当。当然现实生活中肯定巴萨占优,然而单纯的概率分布没法考虑到球队真实实力或是主场优势,所以除非有一个更复杂的贝叶斯模型,目前我对这些因素是无能为力的。蒙特卡洛法虽然可以覆盖可能性,但却不能从根本上解决偏差。

注3:如何去理解16强对手的概率?这个要从淘汰赛抽签规则来说,因为我们99.999%锁定了前八,我就直接假设了。9-24球队两两凑对,跟另外两对抽签打附加赛,所以16强我们在每个位置上有4个可能出现的对手,详见最后一张图(欧足联官网提供)。比如我们第一阶段排第三,那么可能出现的对手是13、14、19、20。此处我们忽略附加赛的胜负结果,仅统计作为阿森纳16强对手的那四个位置的球队,最后算一个可能性(此处并不是这支球队最终成为阿森纳16强对手的可能性,而是这支球队落入阿森纳16强对手的那四个位置的可能性)。

发布于新泽西阅读 7648

这些回复亮了

discusser-avatar

Gabi傍地走安能辨我是雌雄楼主

· 新泽西

这个预测遵从概率学但并不能完全涵盖足球比赛的客观规律。它只是描绘了些许可能性,如果你不相信数字,那当乐子看看就好

GIF
亮了(28)
回复