NBA球队数据分析主管亲承,高阶数据为詹姆斯量身定制。怎么还有人看高阶?

avatar
关注

因为人家根本没这么说。与其说是为詹姆斯、库里、保罗等人量身定制,更不如说是为强者定制。邓肯、加内特、诺维茨基也定制了。而且在这些人定制之前,乔丹、魔术师、伯德已经定制了。


本帖为辟谣贴。俗话说:造谣一张嘴,辟谣跑断腿。烦请看到本帖的理性球迷多多点赞、评论,让更多人看到。


今天有个帖子号称“实锤”高阶数据为詹姆斯定制,理由竟然只是一篇文章中前爵士数据分析主管Jez的言论。这个帖子试图诱导大家相信,RAPM是为詹姆斯定制的,而其他的高阶数据基于RAPM,自然也是定制,所以他们都是废纸。然而,这位前爵士数据分析主管前说的根本不是RAPM!


想了解RAPM,可以参考笔者这篇帖子,非常浅,数学好的各位可以自行google了解。https://bbs.hupu.com/57876048.html

如果不想了解,你只需要明白RAPM是一个不依赖基础数据、最接近真相的高阶数据,目前主流的一体化高阶都融合了RAPM。如EPM、LEBRON、RPM等,因此这类衍生高阶也被称为xRAPM


Jez的言论来自这篇介绍各类高阶数据的文章,本文后面的若干截图均来自此文。有兴趣可以读一读,这是一篇很好的高阶科普文,而且采访了专业人士给各种高阶的可靠性打了分。

https://hoopshype.com/lists/advanced-stats-nba-real-plus-minus-rapm-win-shares-analytics/

造谣帖在这里,希望虎扑处理一下这种行为。https://bbs.hupu.com/58158753.html


让我简单解释一下这件事情有多可笑。


(一)看结论也知道可笑。

网络上有些人特别喜欢阴谋论,并深信不疑。

高阶数据为詹姆斯定制,这是很严重的事情。别说实锤,但凡有点影子,肯定有人会出来说话——这么多经理、教练、球探、数据专家,一个有良心的都没有?都被詹姆斯买通/操控了吗?

曲解Jez的言论,就想“实锤”高阶数据为詹姆斯定制,是“众人皆醉我独醒”。哪怕他真的这么说了,也是孤证不立,更何况他根本没这么说!


(二)看看Jez说了什么。

这是文章关键内容的截图:

RAPM计算中有先验值(priors)。为了让不懂贝叶斯的人理解先验,Jez举了一个通俗的例子,即:“我们都知道詹姆斯很强,因此不需要上百个回合来告诉我们这一点,所以可以加一个先验来降噪”。(蓝色部分)。

Jez只是举一个通俗的例子,碰巧随口说了一个他觉得比较强的球员——詹姆斯,却被别有用心者用来指控詹姆斯操纵了高阶数据。荒唐。幼儿园老师听了都摇头!


(三)Jez说的根本不是RAPM。

Jez说,因为大家都知道一些球员强,所以可以加先验。这属于歧视性的先验,但如果理解RAPM是什么,你就会敏感地发现RAPM里根本没有这样的先验。

RAPM里有先验,原因是从APM到RAPM会用到岭回归。但岭回归的先验根本不是歧视性的,而是统一加一个λ。那Jez在说什么呢?

请看红色部分,说的是RAPM有两种,一种带先验(Prior Informed,PI),一种不带先验(Non Prior Informed, NPI)。在黄色部分,提到先验可以帮助高阶通过目测,于是有了蓝色部分Jez对先验的解释。哎?RAPM不是都带先验吗?怎么还有带先验和不带先验的区分?

请看这篇文章介绍其他高阶的时候,是怎么描述的。

看到了吗,LEBRON、EPM、RPM的数据类型都被定义成了Prior Informed RAPM。哎?文章不是说RAPM分成Prior Informed和Non Prior Informed两种吗?


但这篇文章在介绍RAPM的时候,定义是Pure on-off impact with no box score。所以真相只有一个:这篇文章所谓Prior Informed RAPM(PI RAPM),是指xRAPM,也就是RAPM衍生出的LEBRON、EPM、RPM这些高阶,但不是RAPM本身。Non Prior Informed RAPM,指的才是RAPM本身。Jez所说的先验,是指xRAPM加入的先验,根本不是RAPM岭回归处理中加的先验。


(四)那RAPM衍生出来的xRAPM到底靠不靠谱。

首先大家要明白RAPM如此厉害,为什么还需要xRAPM呢?原因是RAPM需求的样本量太大。xRAPM是用来评价单赛季表现,因此样本不足,所以需要加入歧视性先验(Box Score,上一季的xRAPM,年龄,球队强度等)。

我不会说xRAPM是绝对靠谱的,但目前主流xRAPM可靠性已经比以前高了许多,而且如果所有的xRAPM都指向同一结论,应该找找球员的问题而不是数据的问题。


总结:爵士前数据分析主管只是拿詹姆斯举个例子解释先验,却被别有用心者用来当作詹姆斯操纵RAPM的证据。更何况,他讲的先验是xRAPM里的先验,跟RAPM本身无关。


奉劝:

别因为高阶数据对偶像不友好,就肆意造谣诋毁高阶数据,仿佛你比所有人都聪明。请上点干货,别以偏概全,更不应该造谣。

不懂数学/英语没问题,但不懂数学/英语还强行瞎黑就很丢人了。岭回归里的先验和Jez所说的先验明显不是一回事,别看到别人的翻译里有先验,笔者的帖子里有先验,就直接划等号,一通造谣。更何况,就算是同一个先验,那也根本不是定制啊?


最后,请大家欣赏一下权威的RAPM统计。这个统计结果与你的目测相符吗?欢迎留言评论。


(完)

湿乎乎的话题詹姆斯理发店篮球之家
发布于北京阅读 39532

这些回复亮了

discusser-avatar

CatDorra

· 浙江

这个人在b站抖音也发了帖子,简直太降智了,更降智的是他贴的是一篇正常人根本看不懂的机翻,结果下面一群人在那自嗨。这是我在虎扑见过最降智的帖子之一了,我打赌下面回帖的没一个看懂原文和机翻了,我怀疑他们事实上根本没看过。国内的环境已经到了根本不需要依据只要甩出一个观点就有人呼应的地步了

亮了(476)
查看回复(2)
回复
discusser-avatar

铁铸罗汉楼主

· 北京
跪裤衩不打老四鸡史下水道牢大高阶数据没啥吊用,能赢球夺冠就行。收起

确实,比如老鱼五冠,霍里七冠

亮了(506)
查看回复(6)
回复
discusser-avatar

24号精神科

· 广东
哎我詹能有王朝就好了当你说出这样的话的时候,其实你已经输了收起

有啥问题?不是顺着你逻辑来的?

亮了(247)
回复