对高阶数据无用论的反驳,从bpm说起

关注

众所周知,高阶数据bpm计算公式中,最主要的就是对基础数据的加权相加,而如何确定各项数据的系数则是重中之重。总有球迷认为,这个系数是作者个人臆想确定的,但这种说法是可笑的。

事实上,bpm公式中的各项系数都是通过计算得出来的,而非作者拍脑袋决定的。bpm希望通过结合各项基础数据,展示球员的真实实力。当时有一个高阶数据已经得到广泛认可,那就是rapm真实正负值。作者希望bpm通过基础数据模拟出rapm,从而可以简单通过基础数据得出一个球员的评价。也就是说,一个球员的rapm越高,bpm也应当越高。由此,作者通过回归计算确定了bpm公式中的各项系数,使得bpm能够最接近rapm的结果,也就最接近球员的实力。

而对bpm的质疑,主要源于两个事件,一是威少bpm过高,直接导致了bpm公式的修改。二是近些年约基奇再次统治了bpm。

对bpm的修改最主要是对球员位置做了区分,也就是从1号位到5号位有不同的系数,这直接使得威少的bpm大幅下降。这次修改其实是有道理的,不同球员由于在场职责不同,因此各项基础数据的价值也不同。

此次修改中,最饱受争议的是后卫球员的后场篮板系数为负数,但这也可以解释,因为一个后卫能抢这么多篮板有可能是因为放空了自己的在外线的对位人,跑到篮下抢了没啥对抗的篮板,也可能会因此影响快攻反击。总之,请大家意识到,这个系数为负,不是作者臆想出来的,而是计算出来的。只有这个系数为负,bpm才能最接近rapm,因此以上逻辑大概是可以成立的。

而近些年约基奇高阶数据很高,则反过来印证了高阶数据的价值。在21年22年,大家都嘲笑约基奇为高姐,说他一事无成,说他夺冠没戏。23夺冠后大部分球迷才意识到约基奇的强大,称其为联盟第一人。而bpm提前两年就确定了约基奇联盟第一人的实力。

当然bpm也有很多缺点,能想到的有以下几点。1.它只考虑了基础数据,现在有更多数据可供参考。2.它将各项数据加权线性相加,但相当多数据是非线性的。3.防守端dbpm是由总bpm减去进攻端obpm得到,逻辑过于简单,同时受到bpm和obpm两个数据的误差影响,参考价值有限。4.rapm真实正负值的准确性直接决定了bpm的准确性。5.早些年nba的环境和现在截然不同,用历史数据来确定bpm的系数会有跟不上时代的情况。

尽管有以上种种缺点,但bpm依然具有相当大的参考价值。只有结合多种高阶数据,基础数据和实际球场表现,才能对一个球员有正确的评价。

参考资料:太吾车神

发布于上海阅读 59260

这些回复亮了

discusser-avatar

江东猛虎孙伯符

· 重庆
寄居蟹六跪那就怪了,有人数据那么牛逼,才能在屡次换队爆團的情况下,总决赛22剩33负,难道数据和胜负是反着来的?
收起

很正常,因为你看总决赛看不到那些首轮就出局的人

亮了(391)
查看回复(7)
回复
discusser-avatar

laopaaaa

· 湖北
库里历史前十曼巴十一当一个数据对前二十大球星里只对一个人失效的前提下,只能说这个效率值挺准确的收起

你是不认识魔术还是不认识大梦?

GIF
亮了(191)
查看回复(7)
回复