辟谣:所谓高阶数据是为詹姆斯定制的,这句话为造谣的无稽之谈

avatar
关注

之前有个帖子号称“实锤”高阶数据为詹姆斯定制,理由竟然只是一篇文章中前爵士数据分析主管Jez的言论。这个帖子试图诱导大家相信,RAPM是为詹姆斯定制的,而其他的高阶数据基于RAPM,自然也是定制,所以他们都是废纸。然而,这位前爵士数据分析主管前说的根本不是RAPM

想了解RAPM,可以参考这篇帖子,非常浅,数学好的各位可以自行google了解。

https://bbs.hupu.com/57876048.html

如果不想了解,你只需要明白RAPM是一个不依赖基础数据、最接近真相的高阶数据,目前主流的一体化高阶都融合了RAPM。如EPM、LEBRON、RPM等,因此这类衍生高阶也被称为xRAPM。

Jez的言论来自这篇介绍各类高阶数据的文章,有兴趣可以读一读,这是一篇很好的高阶科普文,而且采访了专业人士给各种高阶的可靠性打了分。

https://hoopshype.com/lists/advanced-stats-nba-real-plus-minus-rapm-win-shares-analytics/

让我简单解释一下这件事情有多可笑。

(一)看结论也知道可笑。

网络上有些人特别喜欢阴谋论,并深信不疑。

高阶数据为詹姆斯定制,这是很严重的事情。别说实锤,但凡有点影子,肯定有人会出来说话——这么多经理、教练、球探、数据专家,一个有良心的都没有?都被詹姆斯买通/操控了吗?

曲解Jez的言论,就想“实锤”高阶数据为詹姆斯定制,是“众人皆醉我独醒”。哪怕他真的这么说了,也是孤证不立,更何况他根本没这么说

RAPM计算中有先验值(priors)。为了让不懂贝叶斯的人理解先验,Jez举了一个通俗的例子,即:“我们都知道詹姆斯很强,因此不需要上百个回合来告诉我们这一点,所以可以加一个先验来降噪”。

Jez只是举一个通俗的例子,碰巧随口说了一个他觉得比较强的球员——詹姆斯,却被别有用心者用来指控詹姆斯操纵了高阶数据。荒唐。幼儿园老师听了都摇头!

(三)Jez说的根本不是RAPM。

Jez说,因为大家都知道一些球员强,所以可以加先验。这属于歧视性的先验,但如果理解RAPM是什么,你就会敏感地发现RAPM里根本没有这样的先验。

RAPM里有先验,原因是从APM到RAPM会用到岭回归。但岭回归的先验根本不是歧视性的,而是统一加一个λ。

(四)那RAPM衍生出来的xRAPM到底靠不靠谱。

首先大家要明白RAPM如此厉害,为什么还需要xRAPM呢?原因是RAPM需求的样本量太大。xRAPM是用来评价单赛季表现,因此样本不足,所以需要加入歧视性先验(Box Score,上一季的xRAPM,年龄,球队强度等)。

我不会说xRAPM是绝对靠谱的,但目前主流xRAPM可靠性已经比以前高了许多,而且如果所有的xRAPM都指向同一结论,应该找找球员的问题而不是数据的问题。

总结:爵士前数据分析主管只是拿詹姆斯举个例子解释先验,却被别有用心者用来当作詹姆斯操纵RAPM的证据。更何况,他讲的先验是xRAPM里的先验,跟RAPM本身无关。

奉劝:

别因为高阶数据对偶像不友好,就肆意造谣诋毁高阶数据,仿佛你比所有人都聪明。请上点干货,别以偏概全,更不应该造谣。

不懂数学/英语没问题,但不懂数学/英语还强行瞎黑就很丢人了。岭回归里的先验和Jez所说的先验明显不是一回事。

发布于吉林阅读 5315

这些回复亮了

discusser-avatar

去球场整点数据

· 江西

老张:定不定制都没关系,你不如先给我一个标准,我指定按着标准整出漂亮的数据。

亮了(97)
查看回复(1)
回复
discusser-avatar

ioga

· 山东

不是,说数据迁就老张,是倒果为因。应该是老张精算大师,打球迁就数据。

亮了(50)
查看回复(3)
回复