辟谣:所谓高阶数据是为詹姆斯定制的,这句话为造谣的无稽之谈
之前有个帖子号称“实锤”高阶数据为詹姆斯定制,理由竟然只是一篇文章中前爵士数据分析主管Jez的言论。这个帖子试图诱导大家相信,RAPM是为詹姆斯定制的,而其他的高阶数据基于RAPM,自然也是定制,所以他们都是废纸。然而,这位前爵士数据分析主管前说的根本不是RAPM
想了解RAPM,可以参考这篇帖子,非常浅,数学好的各位可以自行google了解。
https://bbs.hupu.com/57876048.html
如果不想了解,你只需要明白RAPM是一个不依赖基础数据、最接近真相的高阶数据,目前主流的一体化高阶都融合了RAPM。如EPM、LEBRON、RPM等,因此这类衍生高阶也被称为xRAPM。
Jez的言论来自这篇介绍各类高阶数据的文章,有兴趣可以读一读,这是一篇很好的高阶科普文,而且采访了专业人士给各种高阶的可靠性打了分。
https://hoopshype.com/lists/advanced-stats-nba-real-plus-minus-rapm-win-shares-analytics/
让我简单解释一下这件事情有多可笑。
(一)看结论也知道可笑。
网络上有些人特别喜欢阴谋论,并深信不疑。
高阶数据为詹姆斯定制,这是很严重的事情。别说实锤,但凡有点影子,肯定有人会出来说话——这么多经理、教练、球探、数据专家,一个有良心的都没有?都被詹姆斯买通/操控了吗?
曲解Jez的言论,就想“实锤”高阶数据为詹姆斯定制,是“众人皆醉我独醒”。哪怕他真的这么说了,也是孤证不立,更何况他根本没这么说
RAPM计算中有先验值(priors)。为了让不懂贝叶斯的人理解先验,Jez举了一个通俗的例子,即:“我们都知道詹姆斯很强,因此不需要上百个回合来告诉我们这一点,所以可以加一个先验来降噪”。
Jez只是举一个通俗的例子,碰巧随口说了一个他觉得比较强的球员——詹姆斯,却被别有用心者用来指控詹姆斯操纵了高阶数据。荒唐。幼儿园老师听了都摇头!
(三)Jez说的根本不是RAPM。
Jez说,因为大家都知道一些球员强,所以可以加先验。这属于歧视性的先验,但如果理解RAPM是什么,你就会敏感地发现RAPM里根本没有这样的先验。
RAPM里有先验,原因是从APM到RAPM会用到岭回归。但岭回归的先验根本不是歧视性的,而是统一加一个λ。
(四)那RAPM衍生出来的xRAPM到底靠不靠谱。
首先大家要明白RAPM如此厉害,为什么还需要xRAPM呢?原因是RAPM需求的样本量太大。xRAPM是用来评价单赛季表现,因此样本不足,所以需要加入歧视性先验(Box Score,上一季的xRAPM,年龄,球队强度等)。
我不会说xRAPM是绝对靠谱的,但目前主流xRAPM可靠性已经比以前高了许多,而且如果所有的xRAPM都指向同一结论,应该找找球员的问题而不是数据的问题。
总结:爵士前数据分析主管只是拿詹姆斯举个例子解释先验,却被别有用心者用来当作詹姆斯操纵RAPM的证据。更何况,他讲的先验是xRAPM里的先验,跟RAPM本身无关。
奉劝:
别因为高阶数据对偶像不友好,就肆意造谣诋毁高阶数据,仿佛你比所有人都聪明。请上点干货,别以偏概全,更不应该造谣。
不懂数学/英语没问题,但不懂数学/英语还强行瞎黑就很丢人了。岭回归里的先验和Jez所说的先验明显不是一回事。
去球场整点数据
· 江西老张:定不定制都没关系,你不如先给我一个标准,我指定按着标准整出漂亮的数据。
ioga
· 山东不是,说数据迁就老张,是倒果为因。应该是老张精算大师,打球迁就数据。