【数据】四大满贯哪个冷门最多?

avatar
关注

昨天看到有人在讨论四大满贯哪个冷门最多的问题,于是我去搜集数据做了一点简单的数据分析。

先说结论,冷门情况:美网>温网>法网>澳网,美网最冷,澳网最不冷。


衡量冷门多少,或者赛事冷不冷,本人暂时想到三个方法:

1、种子保留率:比如16强里剩下多少前16种子,8强里剩下多少前8种子,种子保留率越低越冷;

2、特殊球员晋级率:比如保护排名、幸运落败者、资格赛球员、外卡球员能走多远,特殊球员晋级率越高越冷;

3、下克上次数:比如低排位选手击败高排位选手,同时考虑两者排名差,下克上次数越多越冷。


时间关系,我们选择“种子保留率”进行计算,四大满贯均选择过去10届,一共40届比赛。

处理方法是每届大满贯七轮比赛+最终冠军一共算作8轮,R128、R64、R32、R16、QF、SF、F、W。

最理想情况,R32及之前前32种子一个不掉,R16由前16种子包揽,QF由前8种子包揽,SF由前4种子包揽,F由前2种子包揽,W由1号种子获得。


根据实际的种子保留情况,可以计算每轮种子保留率,比如8强中有6个前8种子,那么保留率=6/8=75%。

种子掉得越早,冷门越大,所以我们给8轮赋予不同权重,5、5、5、4、3、2、1、1。

把每轮的种子保留率×每轮权重,再把10届大满贯平均一下,得到一个种子保留指数,越低越冷。


根据我的计算,澳网、法网、温网、美网的种子保留指数分别是19.06、18.67、17.53、17.24。

数据来源是Ultimate Tennis Statistics网站。

所以,冷门情况:美网>温网>法网>澳网,美网最冷,澳网最不冷。


当前,这一计算方法也有缺陷,之后可以进行改进:

1、本方法将不同种子等效,但实际并非如此,比如1号种子和32号种子第二轮出局的冷门程度完全不同;

2、温网在2002-2019均采用特殊的草地种子排名,其数据和其他三大满贯不具有可比性,按理说采用特殊的草地种子排名有助于减少冷门,但是温网仅比美网稍不冷一点,或许采用世界排名温网会成为最冷大满贯;

3、本方法没有考虑特殊情况,比如22澳德约被驱逐,没有1号种子,影响数据的准确性,但一方面这一意外事件对最终结果的影响很小,另一方面这一意外事件本身就是一个冷门,只不过不是竞技比赛中的冷门而已;

4、本方法过于严苛,比如1、2号种子会师决赛,谁拿冠军应该都不算冷门,但是本方法中两种情况对应的结果完全不同,为此我放宽了理想情况重新计算,新理想情况为R16及之前前32种子一个不掉,QF均为前16种子,SF均为前8种子,F均为前4种子,W由1/2号种子获得,由此得到澳网、法网、温网、美网的种子保留指数分别是21.04、20.70、19.88、19.69,和原结果差别并不大;

5、其他待改进的地方欢迎大家补充。

发布于北京阅读 13214

这些回复亮了

discusser-avatar

惊悚的夜

· 重庆

以前不知道,就近20年来说,法网最不冷。

亮了(40)
查看回复(1)
回复
discusser-avatar

神之手

· 广东

纳达尔之前法网是新人突破的地方,之后就是美网了··美国佬长期瞎搞   

亮了(29)
查看回复(1)
回复