科普一下538(FiveThirtyEight)这个预测网站,顺便猜测给出湖人5%夺冠的原因

avatar
关注
先给出维基百科:FiveThirtyEight,亦称作538,是一个专注于民意调查分析、政治、经济与体育的博客。网站于2008年3月7日建立,其名称来源于美国选举人团中选举人的数量。创建初期仅包含一个由创建者纳特·西尔弗撰写的博客和一个民调采集工具。2010年8月,博客成为了纽约时报网站中的一个特色栏目,当时亦被称为“FiveThirtyEight:纳特·西尔弗的政治微积分”。2013年7月,ESPN宣布其将收购FiveThirtyEight品牌和网站,同时纳特·西尔弗被任命为网站的首席编辑。被ESPN收购后的网站于2014年3月17日正式公布。收购后,FiveThirtyEight扩展了其涵盖的内容,增加了更多诸如政治、体育、科学、经济与流行文化的栏目。

可以看出,FiveThirtyEight这个网站比较知名的就是做主政治类辅以体育类的预测,其最受关注的就是美国大选预测。在2016年美国大选中,微软的 PredictWise、《纽约时报》的 The Upshot、普林斯顿的 Sam Wang 在选举当天早上给出的特朗普获胜概率都在 10% 上下。
唯一一个不同声音正来自 FiveThirtyEight。该网站主编 Nate Silver 给出的概率是 29%,这也差不多是博彩市场开出的赔率。有意思的是,选举前 29% 这个数字引发了巨大争议,许多政治评论员和其他做预测的分析师都认为 Silver 的模型高估了特朗普。
但在那年他依旧算是发挥失常,Silver 过去两届大选对 100 个州的预测只错了一个(2008 年印第安纳),而这一届错了六个。这也得以说明,FiveThirtyEight的模型并非没有漏洞。
这次,对NBA的预测,显然和人们的实际认知发生巨大偏差,众所周知的菠菜公司开出的夺冠赔率,这次也并不契合他的预测结果。所以,FiveThirtyEight对NBA季后赛所建立的预测模型,出现了较大失真。

我找到了他们网站的模型,由于全英文的,有一些专用术语,我英语水平有限,只能大致说一下我看过后的理解,后面评论区我会给出英文全文,理解不对的希望指正。
他们的评分制度经历了从Elo(Elo rating system:是指由匈牙利裔美国物理学家Arpad Elo创建的一个衡量各类对弈活动水平的评价方法,是当今对弈水平评估公认的权威标准,且被广泛用于国际象棋、围棋、足球、篮球等运动。网络游戏的竞技对战系统也采用此分级制度)到CARMELO的演变过程。
伊始的ELO仅建立在每场比赛的胜负、分差和地点上。对球队人员的变化导致球队实力的改变则不能及时的调整,由此推出了CARM-ELO【据相关提示猜测CARM一词来源为Monte Carlo method:蒙特卡罗方法,也称统计模拟方法,是1940年代中期由于科学技术的发展和电子计算机的发明,而提出的一种以概率统计理论为指导的数值计算方法。是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。与它对应的是确定性算法。蒙特卡罗方法在金融工程学、宏观经济学、生物医学、计算物理学(如粒子输运计算、量子热力学计算、空气动力学计算)、机器学习等领域应用广泛】模型。将交易纳入了初始模型,但由于超级球队、老将等存在常规赛划水的情况会导致季后赛预测失真。
为了完善模型,开始将老将季后赛经验纳入初始数据,但仍然在2017-2018金州勇士队出现了偏差,这些超级球队往往在漫长的常规赛里划水,所以决定对预测系统增添了更多的模型:
在新的球队模型中,不再以球队为基础,而是以球员为基本单位,将每一个球员进行建模,将每一个球员的历史生涯为模板,生成了其进攻和防守评分,这代表了他上场后对球队效率的影响力。将球员数据重新整合为新的RAPTOR模型。此模型的介绍比预测模型的内容多了一多倍,实在没有耐心去看了,等会贴在评论区。
这赛季中各项模型前五人:
季后赛RAPTOR模型排名(上场时间200分钟以上)

湖人球员季后赛模型
火箭球员季后赛模型

此预测会根据比赛结果将模型每日更新。虽然数值差异会有很小的变化,但这在季后赛中,差异会因为确定的剩余比赛会放大。(我的理解是系列赛中假如每一场胜率都是百分之五十,三场过后大比分为2:1,会比1:1两只队伍出线概率发生巨大变化,同时由于累积效应导致夺冠概率变化显著。再比如根据此模型湖人和火箭每一场比赛湖人胜率为40%,在1:1情况下,根据高中概率论知识很容易算出湖人出线概率仅为30%)。
再加上轮换模型,也就是据每个球员在球队的轮换中获得多少场次,在总模型中将它们结合起来。这样可以预测下一场每个球员的上场时间并通过实践给与权重。通过这个系统,我们将能够根据比赛情况来解释整个赛季大多数伤病、交易和轮休。
接下来我们可以根据每场比赛为每个球队生成单独的深度图,根据谁可以参加比赛来计算比赛中此场球队的实力评级。
我们对每个赛季的每场比赛都进行了模拟,直到最终赛季落幕,但对于季后赛有一些特殊调整,包含了球队此前的季后赛经验、和一些球员在季后赛时数据会缩水/上涨,他们的评级将进行调整,这有点像所谓的“季后赛模式”。
补充原文
最后附上一些预测图
可以看出湖人火箭 在当前模型下单场胜率是固定的,等下一场打完后后面的场次随之发生变化。

最近14场准确率只有64%,火箭湖人开打前是6.5:3.5。
九月1日,各阶段预测:
8月25日的预测:
显然可以看出湖人夺冠的概率从18%到9%再到如今的5%,这个模型中火箭几场大比分获胜导致队内每一个人的球场影响力过高,输的比赛由于分差过于小,球员影响力却没怎么下降,从而火箭在此模型中收益。我认为,这个模型缺失了一个重要的因素,就是系列赛获胜的困难度,比如火箭面对比他弱很多的雷霆,理应速战速决,却打满七场,此时大多数人应该认为火箭被严重高估,反而对模型没有影响,甚至因为机场较大的分差导致火箭在模型中受益,看来此模型还有很多完善的空间。

发布于陕西阅读 109306

这些回复亮了

discusser-avatar

艾伦布恩迪亚楼主

· 陕西
小贾白魔格林弄撕乌度卡我信538.像去年预测猛龙一样准收起

去年伤病可以理解,今年在火箭 2:2雷霆时,湖人3:1开拓者,这时两队进军下一轮的概率预测都是百分之八十,当时两队进西决概率都是五五开,说明当时预测两队交手是五五开。然后神奇的是,火箭4:3雷霆后,火湖两队一场未打,给出火箭胜率突然上升至65%。这是我没想到的。根据高中概率知识65%的单场胜率火箭赢下系列赛概率为80%左右。你敢信,两队还没打,火箭出线概率为八成,这也就导致当时湖人夺冠概率只剩3%1:1后,单场胜率降至60%,此时火箭赢下系列赛概率为70%。 现在谁敢说火箭赢下系列赛有七成胜率? 再乐观的人,也顶多给6成吧。

亮了(44)
查看回复(2)
回复
discusser-avatar

JamesCCCCCC

· 上海

楼主辛苦了,总结的很好很详细而且自己分析的也很好,然而楼上依然包含了“因为某个个例对了所以我依然相信”以及估计文章就不看就继续无脑黑的人,大概就是目前论坛的风气吧。我是始终觉得胜率预测是非常复杂而困难的,巧合的是16年我做数学建模的大作业也做了NBA季后赛结果预测,也用了elo以及各种基于球员的数据,最后得到的骑士获胜概率也不到20%,而四场过后espn更是调到了经典的3%,我从我的例子中观察到的结论就是世界的复杂性远超只能部分描述这些复杂性的数据,也许人们的直观感受加上数据分析能推断一部分未来,但是依然远不是全部事实

亮了(15)
查看回复(2)
回复