【火箭社·翻译】高阶防守数据:那些难以量化的脏活累活-Part 1

avatar
关注

文章内容较多,将分成多部分发布,还请谅解


约基奇这赛季是一个糟糕的防守者。这位掘金队中锋也许是NBA最神奇的进攻创造者之一,但根据NBA Shot Charts的RAPM值(正则化校正正负值),一项用于体现球员比赛影响力的高阶数据显示,约基奇的每百回合RAPM值要比联盟平均水平要低1.2分。在本赛季上场至少1000分钟球员里,他的RAPM值只能排在全联盟后8%。

 

但实际上,约基奇这赛季又是一个平均水平的防守者。根据FiveThirtyEight的RAPTOR算法,用于计算球员的真实攻防评分和胜利贡献度的高阶数据算法,在RAPTOR算法中,约基奇的防守评分要比联盟平均水平高0.8分,能排在全联盟前65%。

 

抱歉,这里又要改口了:约基奇本赛季是一个极其出色的防守球员,根据ESPN的RPM(真实正负值),用于计算每百回合球员在场时球队的得失分数,该数据显示,约基奇的防守RPM值要比联盟平均水平要高1.7分,排在字母哥、吉米-巴特勒和德拉蒙德-格林等球队防守中坚之前,排全联盟前20%。

 

而约基奇则认为自己的防守处于最好和最差中间,他说道:“我想我处在中间位置,我觉得自己的防守没那么好,也没那么糟糕”

 

如果上面这些话让你听的云里雾里,那么欢迎你进入高阶防守数据的世界——这也是篮球数字分析学的难点所在。这些高阶数据不仅会关系到约基奇能否拿到MVP,还能判断联盟中的每一名球员的防守倾向。多年来,为了能寻找到一种更好的方式去评估和比较球员,那些放飞自我的篮球分析师花费了数年时间去完善他们的防守评价指标。球队管理层同样在仔细研究这些高阶数据,以求在人事决策上建立起优势。球员自身同样能从中受益,因为那些更加精准的防守高阶数据将给顶级防守者带来一份更大的合同。我们有足够多的动机去开发更加先进的防守评价指标——然而就目前的情况来看,这些公开和非公开的评价指标没有一个经得起推敲。

 

76人队篮球运营总裁达里尔-莫雷说道:“在防守数据分析上,没人敢说精通,这是一项非常复杂的数据。”

 

为了大致了解一下已知的防守评价指标的公信力,我们联系了十几位NBA分析师,其中包括球队雇员和公开撰稿人,他们中的大多数都曾为球队做过数据分析工作,我们邀请他们对这些防守指标进行打分,评分标准从1分到10分,他们给已公开的防守评价指标打出的平均分只有3.6分,而他们对于球队内部防守评价指标的看法同样没好到哪儿去。

NBA某队的一位人事主管,他给出的评分是这十几个人里最低的,他给已公开的防守评价指标打出了1.5分,他解释道:“从分析学角度看,你只能祈祷这些数据能够反映真实情况。我们建立的联盟防守数据模型,自始至终一直是我们最薄弱的环节,全联盟真的没有谁真的能建立起特别好的防守数据模型。”

 

多年来,棒球一直信心满满的靠着数据模型分析,去寻找那些能让球队获胜的球员。然而,就篮球的单项数据评价指标来说,它的误差值要更大,尤其是防守评价指标。

 

这位人事主管接着说道:“如果我们能说出‘嘿,赢球了就不用更换现有的评价指标了吧,咱们继续用它去寻找争冠拼图吧’,那可就谢天谢地了,然而现实并不像2K经理人模式那么简单。”

 

在这个依靠节奏和进攻空间的时代,NBA每赛季都会创造新的进攻效率记录,这不仅让防守变的更难了,也让防守评价指标的确定变得异常艰难。防守数据的缺失最早能追溯到数据统计仅统计得分的那段时期,在20世纪40年代至50年代期间,当时的统计数据只有得分,进球数和罚球数——一项防守数据都没有。尽管其他数据,诸如助攻和打铁数已经出现在每天的报纸上了,但那时的防守数据统计还是很落伍的:NBA直到1973-74赛季才开始统计盖帽数和抢断数,这意味着早期的那些传奇球星,像比尔-拉塞尔和威尔特-张伯伦的防守数据都丢失了。

(注:NBA最早的统计数据,该数据展示了鲍勃-库西率领的凯尔特人队和乔治-麦肯率领的湖人队的比赛数据,图中的G表示投篮命中数,F表示罚球数,T表示总得分)

 

早期的统计数据大都集中在记录那些容易记录的数据上,而防守概念——大都停留在像适当的防守轮转和有效的回防这种抽象且模糊的概念上——防守数据基本上被人们忽略了。

 

BPM值(基础正负值)的发明人丹尼尔-迈尔斯表示:“有很多东西是没办法用数据去衡量的,这就是为什么在70年后的今天,我们依然在讨论这个话题。”

 

最终,只有四项防守数据被纳入到传统的统计数据里,分别是:篮板,犯规,盖帽和抢断。然而这四项数据都存在一定的问题。

 

在迈尔斯看来,防守篮板是最鸡肋的一项数据,因为防守篮板的多少取决于球员在场上承担的角色而非他的篮板球技术;根据追踪数据显示,全联盟有24%的防守篮板存在一定的争议性,此外一名球员的篮板球数据不会对他所在球队的篮板球数据带来太大影响。举个例子,比方说安德烈-德拉蒙德,单从数据看,他应该是NBA历史上最棒的防守篮板手,然而当德拉蒙德下场休息时,他所在的球队不仅进攻篮板比他在场时丢的更少,丢分也要更少。

 

犯规同样是一项令人难以捉摸的数据——迈尔斯将犯规形容为“难以界定的无效数据”,因为这项数据只能反映防守强度有多大。

 

迈尔斯接着说道:“因此,只剩下抢断和盖冒了,然而这两项数据又极度稀缺。”

 

这赛季,全联盟平均每八回合才能产生一次盖帽或抢断,这意味着,每名球员平均40个回合才能得到一次盖帽或抢断,而这名球员的这40个防守回合中的39个回合没有任何防守数据,因此没人知道他在防守端为最后的胜利做出多少贡献。这种不公平的评价指标也对统计数据中的其他指标带来了影响,比如PER(球员效率值),这项数据的创造者约翰-霍林格指出,PER值严重低估了那些没有得到太多盖帽和抢断的防守专家。

 

用曾在开拓者和76人担任高管的本-福尔克的话来形容所有这些叠加在一起的问题要再合适不过了,他在评价用统计数据判断球员防守能力时曾说过:“这就像眯着眼睛看一张模糊的照片,并试图在照片上找到点什么。”

 

阿尔伯特-爱因斯坦从未试图在篮下挑战过张伯伦,但他的那句名言还是能完美的诠释这一切:“并非所有能被计算的东西都拥有价值,并非所有有价值的东西都能被计算。”(Not everything that can be counted counts, and not everything that counts can be counted)

发布于吉林阅读 27503

这些回复亮了

discusser-avatar

Chauncy_Hui

· 安徽

文章太棒了!!!数据分析+球探+录像分析才能相对更好的评价球员,但不论怎样,那些很少看完整比赛,也不熟悉数据统计,只是从“性格”和“态度”这样的角度来评价球员的“心里分析大师”都是荒谬的。。。另外我觉得这篇文章有给约基奇的MVP评选拉票的意思🐶

亮了(87)
查看回复(2)
回复
discusser-avatar

MrWeei楼主

· 吉林
Chauncy_Hui文章太棒了!!!数据分析+球探+录像分析才能相对更好的评价球员,但不论怎样,那些很少看完整比赛,也不熟悉数据统计,只是从“性格”和“态度”这样的角度来评价球员的“心里分析大师”都是荒谬的。。。另外我觉得这篇文章有给约基奇的MVP评选拉票的意思🐶收起

谢谢捧场,我觉得作者挺中立客观了,这篇原文确实很有深度

亮了(27)
查看回复(1)
回复