约基奇高阶数据超乔丹了,他比乔丹还强吗?
高阶数据这东西是新世纪Excel普及后创造的,比如著名的PER诞生于2006年。
这个帖太长不利于阅读,新开一贴讲PeR,请看我的下一贴。
老一辈球员大多只知道带队赢球,并不太考虑高阶数据,而从客观性以及合理性上,确实高阶数据也存在极大的问题,我先来说一些高阶数据的问题。
举科比与高阶数据并不适配的原因,在高阶数据分析完以后估计所有人也能知道个七七八八,我再说一下其他因素。高阶数据的问题
高阶数据并非客观分析球员的合理依据,常用的高阶数据有PER,WS,BPM,RPM这些,上述的数据都存在着比较致命的缺陷,这里仅以BPM举例(BPM不仅数据烂,而且屁股歪)。
打爆BPM的威斯布鲁克
有一个Excel球迷不太清楚的事情,那就是2016-17赛季,威斯布鲁克打爆了BPM,之所以称为打爆,主要是因为威少的BPM数据超越了之前所有的巨星。
可以看看之前BPM是怎么来计算的。Raw BPM = a*ReMPG + b*ORB% + c*DRB% + d*STL% + e*BLK%+ f*AST% - g*USG%*TO% + h*USG%*(1-TO%)*[2*(TS% - TmTS%) + i*AST% + j*(3PAr -Lg3PAr) - k] + l*sqrt(AST%*TRB%)
原始的BPM公式是这样的,总之就是一堆面板数据加上一个系数,最后算了个结果。但是你要知道16-17赛季的威少是30+以及场均三双的得分王!所以他各种面板数据都拉满了。
然而这里出现一个问题,大家能发现的就是所谓的高阶数据,更适合把面板数据都拉满的球员。
然后如果你仔细看这个BPM公式,就会发现另一个问题,就在这段公式。
h*USG%*(1-TO%)*[2*(TS% - TmTS%) + i*AST% + j*(3PAr -Lg3PAr) - k]
秘密在于(TS% - TmTS%) 的部分,前面的TS是真实命中率,而后面的TmTS则是球队真实命中率,这个数据如果球员本身的真实命中率高于球队则是正的,如果球员低于球队则是负的。
到这里看还是个中性的数据,但实际上隐含着另一层,就是如果某个核心球员打球的时候身边各个球员都CBA,那么TmTS就会很差,这个球员的高阶数据就会变好。
你可以想象一下,其实球员有两类,
一类是持球大核心,所有球都由他来支配,好的机会就自己得分,不好的机会就分给队友出手。这样就会让自己的高阶数据更好看。
另一类则是球权全队尽量均衡的分配,艰难的球自己来投,空位的好机会交给队友,这样他自己的高阶数据就会变得难看。
这两类球员如果你仔细看球,在联盟里都不在少数,威斯布鲁克更是第一类持球大核心中的佼佼者。所以他打爆BPM数据也就是理所应当了。
按道理说,你BPM设定了规矩,就相当于做了个题目,威少答题满分,你把他列在历史成绩榜第一就可以了,但BPM说不,威少不能第一,就因此把题目改了!这简直就是贻笑大方!
///
BPM的改进
BPM在威少刷爆之后做了算法的变更,但并没有纠正自己的错误,反而是针对威少以及控卫进行了专项的Debuff,以此来让自己希望排名靠前的球员继续名列前茅。
原本公式里那些系数已经毫无依据,这次的改动更是令人啼笑皆非。
众所周知,在BPM的世界里,DBPM毫无意义,因为DBPM仅仅是BPM与OBPM的差值,由于公式里系数的问题,会造成进攻能力强的球员OBPM溢出,造成DBPM为负数的情况,完全不能体现出球员真正的防守能力,在此不做赘述,就单独说BPM和OBPM。
BPM改进的方式非常粗暴,就是将球员的位置从1到5做了高下之分,比如在篮板这个数据上,1号位(控卫,PG)得到防守篮板的系数最低,而5号位最高。这一条我就看不懂了,凭什么5号位拿个防守篮板系数最高,本来不就是5号位拿篮板最容易嘛?
再来看助攻,也是1号位拿到助攻的系数最低,5号位最高,所以除了威少这种故意持球刷数据的以外,其他控卫全部被误伤?另外就是助攻这个系数高的令人咋舌!差不多和得分一样高,这个其实并不合理,因为助攻并不是一项主动数据,是需要接球后球员投篮才能生成,也就是完全依赖投篮人员是否命中产生,其实助攻就是命中后的衍生数据,只要控球过关,你是持球大核心,想刷的话谁都能刷10个8个的助攻。助攻数量只是持球人员传给最后出手人员数量高就行,与组织能力没有直接关系。最重要的是,为什么助攻还分三六九等,中锋的助攻和控卫的助攻加权系数为何不是一样?
进攻篮板倒是控卫系数最高,可进攻篮板一场比赛才能有几个,控卫又能拿到几个?
反而到了抢断这里控卫的系数最高了,这个不应该是5号位最难拿嘛?你看看抢断王里多少控卫?有几个是中锋?
离谱的是这个什么位置调整常数,更是赤裸裸的直接给1号位上debuff,其余位置都没事儿!
还有令我不理解的就是出手情况这里,又不按照所在位置计算了,球员面板主要是加分项,到了出手和罚球这里就是扣分的了,计算的方式则是将球员分成了角色,Creator(创造者?),Receiver(接收者?),Neutral(中性者?不知道球员本人对这个词是否喜欢),可以看到创造者扣分最少,而接收者扣分最多。
我很能理解BPM数据制造者的智慧,大家也都能清楚这个数据对什么类型球员有利,就是一个球员他是创造者,而且还不能是1号位。
最后的结果就是历史BPM排名里,羞辱榜单权威性的威斯布鲁克不在出现在前十名之内!
由于这个BPM用了2017赛季詹姆斯的数据作为案例,我发现了一个非常可笑的情况,这个数据对1号位增加debuff的时候把詹姆斯放到SF(3号位)的位置,然后按照出手数量扣分的时候就把詹姆斯放到扣分最少的Creator这个扣分少的位置上,完全符合创造这个数据的初衷。
说真的,我一点不认为Creator位置出手的FGA扣分应该比Receiver少,现在很多球队都是持球大核心,Receiver很多都是接锅球,你不给Receiver上加成,至少和Creator一样吧?
所以到这里就能看出来BPM这个数据制造者为了将威斯布鲁克从历史榜单第一拿掉,把詹姆斯放上去多么用心良苦,绞尽脑汁(毕竟但凡这些系数出一点偏差,乔丹可就又排在詹姆斯前面了,那不还得重排)!
就从Creator和Receiver这种发明,诺贝尔下次颁奖没有你们我都不看!
回过头再看OBPM的公式,看过刚才的分析大家都应该明白里面的套路了。
在OBPM的公式里,1号位拿篮板居然是扣分的!扣分!这不是扯吗?要么你觉得防守篮板对进攻不重要那就不要放进来,你放进来就为了给1号位扣分是什么居心?!
然后就又回到了Creator的环节了,前面套路已经说完了,不再赘述。上结果吧,库里顶着1号位的巨大DEBUFF拿到了历史OBPM第一名,这与他不抢队友数据有关,也与他逆天的进攻端统治力有关。然后就是NBA历史十届得分王获得者乔丹居然前五名里都没有他!
我差点懵了!你要说别的我还能理解,迈克尔乔丹,十届得分王,几乎只要他打球就是得分王,甚至不会让这个荣誉旁落的人,历史OBPM前五居然没有他!我估计就是后面计算出手那里没把乔丹放在Creator的位置吧!具体怎么算,大家可以自己去看。
DBPM就不说了,丹尼斯罗德曼,2届DPOY,7届篮板王,多年防守一阵,常年DBPM接近于0,甚至是负数。这数据就不说啥了,自己品吧。
给BPM下个结论——修改以前就是个笑话,修改以后只是让这个笑话升级了!
小镇做题家威少凭本事拿到第一,居然楞给改了题目!哈哈!
同情况的,还有其他几种高阶数据,我再开一贴讲讲。
cr:知乎作者和谐os
想念罗尼
· 四川不要迷信高阶数据,这玩意和基础数据又不一样,又不是直接统计出来的。当高阶数据和赛场表现有差异的时候,难道不是高阶数据有问题吗?
丶别沧海
· 重庆高阶数据就是之前为了包装詹姆斯而量身定制的东西,后来威少有一项数据爆了,又开始修改。这玩意看看就好