[翻译团]觉得NBA防守很难?试试把它量化一下吧[视频]
尼古拉-约基奇可能是这赛季的MVP,但他是一名出色的防守者吗?实际上,数据统计很难回答你这个问题。数据分析的革命已经彻底改变了篮球这项运动,但是每个人(无论是那些首席分析专家,球队分析师,经纪人,还是总经理)仍然不知道如何正确地衡量这项运动的防守。
尼古拉-约基奇在本赛季一直都是个糟糕的防守者。这位掘金中锋可能是NBA最具魔力的进攻创造者,但根据NBA Shot Charts【1】提供的RAPM数据【2】,这项指标旨在衡量球员对比赛的整体影响力,这项数据表明,约基奇在场时对手每100回合多得1.2分,低于平均防守水平。在至少打过1000分钟比赛的球员中中,他仅仅比8%的球员做的好。
译者注1:一家提供有趣数据分析的网站:http://nbashotcharts.com/home
译者注2:英文为:Regularized Adjusted Plus-Minus,简称RAPM,中文名为正则化修正正负值
然而,换个统计方式看的话,约基奇本赛季基本上已经算是一名合格的防守者了。根据FiveThirtyEight【3】的另一项衡量球员对比赛的整体影响力,名为RAPTOR【4】的数据统计显示,约基奇的防守水平比平均值高了0.8,超过了65%的球员。
译者注3:FiveThirtyEight,亦称作538,是一个专注与民意调查分析,政治,经济与体育的博客。
译者注4:英文名:Robust Algorithm (using) Player Tracking (and) On/Off Ratings,简称RAPTOR,国内没有官方中文名,暂译为利用球员跟踪和上下场正负值的鲁棒算法
不好意思,让我们再换个统计方式看,这次约基奇已经是位防守专家了。根据ESPN的一项衡量球员对比赛的整体影响力,名为真实正负值RPM的统计数据显示,约基奇在防守端的表现比平均水平高1.7分,超过了80%的球员,甚至是排在扬尼斯-阿特托昆博,吉米-巴特勒,和德拉蒙德-格林的前面。
约基奇本人则认为自己介于两者之间。他说:“我认为我的防守属于中等水平,不算是一个出色的防守者,但也不至于太差。”
如果这一切听起来令人满头问号,那就对了——欢迎各位来到防守高阶数据统计的世界——这里是体育数据分析里最难破解的领域,我们面临的挑战不仅是评估本赛季约基奇的MVP成色,还要正确衡量联盟中各位球员在防守端的真实表现。
首席数据分析专家们花费了数年的时间来制定自己的防守指标,以寻求更好地评估和比较球员的方法。统计台的工作人员也在努力地减少数据种类,力求用更少的统计指标去在提高人员轮转效率上有所突破。而球员本人也可以从中受益,因为更准确的统计数字可以为顶级防守球员带来更好的报酬。制定高级防御统计数据有各种诱因,但至少就目前而言,现有的防守统计数据无论对整个球队还是对每一个球员而言,都有着不同程度的缺陷,难以胜任。
“没有人能够掌握防守分析,” 76人篮球运营总裁说。“这非常复杂。”
为了大致了解这些统计数据,我们对十多位NBA数据分析师进行了对话,其中包括球队员工和公共作家,其中大多数人以前曾为球队工作过。从1到10的范围内,他们对现阶段公开的防守数据统计的质量打分,平均分只有3.6分。而他们对于球队自主研发的统计数据的质量的评价也高不到哪里去。
译者注5:表格翻译
分析师的答案:NBA的数据统计怎么样?
数据类型 评分
公开的防守数据统计 3.6
球队自己的防守数据统计 5.6
进攻数据统计 7.6
“从分析的角度来看,想要做好防守数据统计基本就是指望着瞎猫抓死耗子,”一支NBA球队的人事主管说,他是整个团队中最悲观的人之一,他对于公开的防守数据统计只打了1.5分。”我们整个联盟的防守数据模型可能是我们数据分析中最薄弱的部分。没有人能够真正拥有好的防守模型。”
多年来,棒球联盟一直很自信地使用胜利贡献值【6】来衡量防守的好坏。但是对于篮球而言,单一的统计指标有着更大的不确定性,尤其是在防守方面。
译者注6:「胜场贡献值」或称「WAR值」(Wins Above Replacement, WAR),是棒球界用来了解一名球员「整体价值」的数据,所显示的数值为,「理论上」一名球员能比一般替补级球员为其球队多带来多少胜场。 WAR值的基本概念是,一名球员他的价值,比一般能替补该位置的球员高出多少。
这位人事主管说:“如果我们能像:‘嘿,啥也别管,直接套公式用WAR来算就行了’,那将是很棒的。但这有点痴人说梦。”
在这个追求节奏与空间的时代,由于NBA的进攻在每个赛季都创造了新的效率记录,因此做好防守非常困难。但是如何更好地评估防守可能会更加困难。
对防守数据统计的缺乏早在篮球诞生之初就有了。在1940和1950年代,唯一记录的统计数据是得分,出手和罚球,根本没有防守数据。即使其他统计数据(例如助攻和投篮不中)进入了日常的数据统计栏,防守统计也是一片空白;直到1973-74年,NBA才开始记录封盖和抢断,这意味着像比尔-拉塞尔和威尔特-张伯伦这样的上古神兽都缺乏防守数据统计。
译者注7:这是一张上古时期的NBA数据统计表,显示的是1951年3月鲍勃-库西的凯尔特人队和乔治-麦肯的湖人队之间的比赛。 “ G”代表投篮命中的得分,“ F”是罚球,“ T”是总得分。 数据统计栏中没有其他任何信息。
早期的数据统计基本上就是简单的计数。因此,所有的防守概念,其中大多数都是模糊的和抽象的,例如适当的轮换或有效的补防都被忽略了。“没有多少事情是可以轻松用数据衡量的,”BPM【8】的发明者丹尼尔-迈尔斯说,该统计使用方框得分统计信息来生成球员评分。“这就是为什么在开始讨论70年后我们仍然进行这些讨论的原因。”
译者注8:暂译为得分正负值,英文全称为Box Plus/Miuns,缩写为BPM,是衡量球员在每100回合超过联盟平均得分的估值,计算方法为:BPM = a×ReMPG + b×ORB% + c×DRB% + d×STL% + e×BLK% + f×AST% - g×USG%×TOV% +h×USG%×(1 - TOV%)×[2×(TS% - TmTS%) + i×AST% + j×(3PAr - Lg3PAr) - k] + l×sqrt(AST%×TRB%) ,定义:联盟平均BPM为0,其中a-l均为参数,由近15年的真实正负值数据做回归分析得到
最终只有四个防守数据进入了传统的技术统计:篮板,犯规,盖帽和抢断。而这几个数据各有各的问题。
迈尔斯说防守篮板“太水了,几乎没有用。” 那是因为他们很大程度上取决于球员的角色而不是技巧。根据NBA官方的球员跟踪数据统计【9】,全联盟只有24%的防守篮板是靠拼抢得到的,并且球员的个人篮板统计数据,与他对球队篮板统计数据的影响之间,并没有很大的关系。例如,按百分比计算,安德烈-德拉蒙德是NBA历史上最好的防守篮板手。但是德拉蒙德的球队把他摁在板凳上时,往往能让对手抢到更少的进攻篮板,失掉更少的分。
译者注9:NBA在13-14赛季开始启用跟踪数据系统,Second Spectrum是现阶段官方光学跟踪系统的合作伙伴,于17-18赛季开始全面启用,该系统能够在每秒钟对比赛中的每个球员和球的位置进行25次监控。
犯规统计也很棘手,“基本上没啥用,”迈尔斯说,因为犯规可能只是防守活动增加的信号。“因此,剩下的只有抢断和盖帽这两个数据了,而这些都是非常罕见的统计数据。”
本赛季,全联盟每八回合会发生一次盖帽或抢断,这意味着每位球员每40个回合平均才会有一个盖帽或抢断。在40个回合中,有39个回合的防守没有任何统计数据,但他仍在以某种方式做出贡献或不做出贡献。这种不平衡还阻碍了其他基于数据统计的指标,例如球员效率值【10】的创建者约翰-霍林格指出这种方法被低估了:“那些防守专家,他们并没有很多盖帽或抢断。”
译者注10:球员效率值,英文为Player efficiency rating,简称PER,其评估了球员每分钟的贡献同时根据比赛节奏进行了调整。在每分钟下,我们可以比较两个出场时间不相同的球员;而节奏调整后,我们就可以比较两个身处节奏不同球队的球员的效率。对于每个赛季联盟固定联盟平均PER为15.00,这也使得不同赛季的球员可以进行比较。
这些重重问题意味着,单单用数据统计来衡量一个球员的防守,就像开拓者和76人队的前高管本-福尔克所说,“就像眯着眼看一幅模糊的画,然后尝试从中寻找一些东西。”
阿尔伯特-爱因斯坦从未和张伯伦通常竞技过,但他那句至理名言却完美地描述了这种情况:“能被计算的,不一定重要;重要的事,不一定能被计算。”【11】
译者注11:事实上,爱因斯坦并没有说过这句话。此名言为社会学家William Bruce Cameron所说。
罗伯特-科温顿从未赢得过年度最佳防守球员的第一选票,但从费城,明尼苏达州到休斯顿再到波特兰,他的球队一直因为他的存在而在防守方面表现得更好。这位锋线摇摆人在抢断和盖帽数据上并不抢眼,但是他的防守表现却让人印象深刻。
回忆一下火箭和雷霆队上个季后赛首轮七场大战:科温顿及时在对手挡拆后换防,延误克里斯-保罗这位未来名人堂控球后卫的突破进攻,并在保罗运球时将球打掉,而一切的脏活累活最终被数据统计记录为PJ-塔克抢断一次。
在过去五个赛季中的四个赛季里,科温顿在每场比赛的截断【12】次数上均排名联盟第一或第二。但是按照传统的技术统计,他不会得到任何数据。这就是“已调整的正负值”的数据框架下的高级指标的用处的体现。
译者注12:原文用的词为Deflection,NBA官网对于deflections的定义为:“一名防守球员或球队在对手的非投篮状态中用手触碰到球,使其方向改变、出界、失误”,典型如破坏对方传球路线,特别注意这不包括形成抢断数据的破坏。中文翻译暂且翻为:“截断”。
在1996-97赛季中,根据每回合比分的数据衍生出了正负值这一数据统计,后来正负值又进一步变成了调整后的正负值,这一改变主要是为了回答以下的基本问题:这名球员上场后球队的失分是变多了还是变少了?而它也已经成为了调整后的正负值的两个主要来源之一。在足够大的样本上,这种分析形式(指通常使用复杂的统计技术来控制这名球员的队友和对手这两个变量)可以说明单个球员对对手得分总数的影响。例如,根据NBA Shot Charts上的RAPM数据,在过去五个赛季中,NBA最有效的防守者包括几个年度最佳防守球员得主和科温顿,防守最差的则是公认的那几个大漏勺。
译者注13:表格翻译:NBA2016-21赛季中最好的防守者和最差的防守者
鲁迪-戈贝尔,最好的防守者:扬尼斯-阿特托昆博,乔尔-恩比德,罗伯特-科温顿,吉米-巴特勒,……,最差的防守者:克林-塞克斯顿,特雷-杨,贾马尔-克劳福德,以赛亚-托马斯,安芬利-西蒙斯
但是尽管有其理论上的支持,但这种统计在实践中并不完美。首先,由于它仅关注每回合的结果而不是过程,因此它可以像黑匣子一样运作。“它回答了'球员的影响是什么?'这样的问题”,卢克-博恩说,他在2017年至2020年担任国王队的战略与分析副总裁。但是,“这对于回答‘为什么球员能有这样的影响’而言根本没有帮助。 ”
以科温顿为例。他的正负值数据很高,但是正如上赛季的季后赛所显示的那样,相比于一个锁定的一对一防守者而言,他更适合作为一个精明的协防者。像保罗和詹姆斯这样的球星可以轻松在错位时在他头上得分,或者无视他的防守上篮得分。基于结果的数据本身不会提供这种细微差别。
另一个问题是,正负值数据需要非常大的样本才能清除另外混淆的变量。塞克斯-帕特诺是雄鹿队2016年至2019年的篮球研究主管,他说:“肯定会有这些统计数据是具有欺骗性的。在某些情况下,一些球员可能会在场上与另一名球员搭档很久,以至于个人贡献很难被分开讨论。替补不给力的时候就自然显得首发球员更厉害了,反之亦然,而且统计数据也受到对方投篮结果的影响,例如在2016-17赛季,马刺在MVP候选人科怀-伦纳德在场的情况下反而会失掉更多的分,因为对手的三分球命中率会提高7.4个百分点。本赛季的正负值指标不喜欢约基奇的一个原因是掘金队的对手在约基奇在场的时候三分球命中率会提高5.9个百分点,这一差距在掘金队所有球员中最高。
BPM创造者迈尔斯说:“单赛季的RAPM数据基本上是无用的,”
然后是摄像机,它们为调整正负值的数据统计提供了第二个数据源。在2009-10赛季之前,由以色列科学家创建并拥有导弹追踪背景的公司SportVU在达拉斯,休斯敦,俄克拉荷马城和圣安东尼奥四个NBA场馆的最高处安装了摄像头。该系统每秒钟对比赛中的每个球员和球的位置进行25次监控,并在2013-14赛季进入每个NBA竞技场。现在由Second Spectrum提供的高级跟踪信息为量化防守提供了不可否认的进步,例如量化了大个子对篮筐的保护。
问题在于数据实在太多了。在常规的82场常规赛中,原始跟踪通过约20亿个单独的数据点(球员的x和y坐标以及球的x,y和z坐标)为团队提供了约10亿个离散位置信息。热火篮球发展和分析副总裁肖恩-巴蒂尔说,跟踪数据可以“带你走进一个完全不同的世界”。
处理所有这些数据来得到有意义的指标并不容易。在进入团队之前,博恩曾在哈佛工作过一段时间,在那里他的研究团队专注于体育统计。他说,该小组“拥有一些计算机科学和统计学领域最杰出的博士生,然而对我们而言,这仍然是一场艰巨的斗争,所以我认为这并不是一件能够真正容易解决的事情。”
最终,限制传统数据统计和正负值数据的问题也同样限制了跟踪摄像机:他们还没有弄清楚如何衡量关键防守的细微差别。追踪分析可以捕获投篮时发生的情况,但在考虑到每个回合的其他部分时,追踪数据也常常会难以胜任。一位NBA的人事主管说过:“防守是无处不在的,比方说我们的中锋在防守时有效地进行了延误和换防,这为我们争取了半秒的时间让弱侧的队友成功外弹去协防对手三分线外的射手,这就是一次好的防守,可是又怎么用数据表现出来呢?”
诸如场上交流之类的无形资产,也是任何坚决防守的关键,也没有被数据统计考虑在内。多个消息源都希望对大个子特别进行音频跟踪,以通过其喊出的防守策略来辨别他们的贡献。即使在几乎任何东西都可以被数据化的棒球中,例如接球手的站位这样细致的防守统计数据也难以表现出一些无形的资产例如接球手会投球手商量投球的球路等等。例如比方说,马克-加索尔,这个被多个消息人士称为联盟里他们第一个想要用音频追踪的球员,他就是NBA的雅迪尔-莫里纳【14】。
译者注14:雅迪尔-莫里纳(Yadier Molina,1982年7月13日-)出生于波多黎各巴阿蒙,是美国职棒大联盟圣路易红雀的捕手,他来自于著名的莫里纳捕手世家,他的两个胞兄班基-莫里纳(Bengie Molina)和荷西-莫里纳都是棒球大联盟的捕手。莫里纳被认为是大联盟中守备最好的捕手之一。他的盗垒阻杀率高达46%,牵制出局数也在所有大联盟捕手中排名第一。
最重要的是,即使是最先进的跟踪系统也无法捕捉球员与教练,队友和防守系统的配合。ESPN的凯文-佩尔顿说:“即使我们拥有了所有想要的所有数据,我也不知道我们是否能够像隔离进攻一样轻易地隔离个人对防守的影响,因为其中很大一部分是按照计划的布置。”
在Second Spectrum能够找到一种衡量球员意图的技术之前(例如防守者应该做什么),防守中的一大方面就这样淹没在了数据中。
例如,巴蒂尔在早期的统计革命中被认为是一名强硬的防守者,他回忆起曾在一场比赛中对卡梅隆-安东尼执行他的比赛计划,但这位明星得分手仍然暴走。“他在我的头上得了50分,绝对是在折磨我,他连禁区都没进一步”,巴蒂尔说。他说,他的防守过程“100%正确”。“有时候你没办法控制结果,这就是一场令人难以相信的表现。”
在棒球运动中,这种对情况的依赖性要小得多,在道奇体育场的一名糟糕的中场得分手也将会在佩特科公园成为一名糟糕中场得分手。然而,在NBA中,一个大个子可能会在激进的快攻进攻计划中挣扎,但如果他能打出阵地战掩护,他的贡献值便会显著提高。在2017-18赛季,ESPN的真实正负值排名中,湖人的布鲁克-洛佩兹是联盟中防守最差的中锋。两个赛季之后,他效力于一支新球队,在新的打球风格和新教练的指导下,他在防守正负值上排名第三,入选了最佳防守阵容,并帮助雄鹿队打出了联盟历史上最出色防守之一。
洛佩兹代表了一个极端的例子,但是纵观整个NBA和所有NBA球员,进攻时的RPM(真实正负值)数据往往比防守时的RPM对赛季的关联性要更强一些。换句话说,一个好的进攻球员在下一个赛季还会是进攻好手,一个不太懂进攻的球员在下一个赛季还是不太懂。但是防守水平似乎有着很强的波动,尤其是对于那些换队的球员们来说。
译者注15:表格翻译为:真实正负值和球员赛季之间的关系
球员状态 进攻真实正负值 防守真实正负值
同一球队 0.79 0.47
换队 0.64 0.27
总体 0.75 0.41
(附注:本图标根据2013-14赛季以来,所有每赛季至少打了1000分钟的所有球员的追踪数据得来)
(数字含义:0代表完全没有关系,1代表非常有关系,也就是说球员进攻水平维持的较为稳定,而防守水平随赛季更替变化较大)
一位球队的首席分析师说:“我们尝试将所有研发一种可以包含一切防守水平的数据指标,这事情有些不太靠谱而且也不值得,即使是那些有着较好数据储备的球队。”当然,这并不能阻挡大家对达到这一目的的尝试。
许许多多有着不同背景的分析师都朝着类似的目标在努力,力求能够找到更好的防守数据指标。其中一些研究人员为球队工作;一些人曾经为球队工作,但现在在公共领域进行统计实验;其他人就像BPM的创建者迈尔斯一样,不仅没在球队工作过,甚至都不是训练有素的统计学家。他说:“我一生中从未上过一节统计学课。”
然而,十多年来,不断改善BPM数据似乎已经成为迈尔斯的一大爱好了,他说:“我认为这很有趣。”
迈尔斯承认,这种有些书呆子的娱乐活动适合担任高级桥梁工程师的人,但也满足了许多球迷对运动员进行比较的需求。他说:“我喜欢看球员的职业发展曲线,看看他们是如何进步的。” 这是BPM仅传统技术统计数据的主要原因之一,因此,即使没有花哨的追踪数据,它也能在整个NBA历史中和现在一样适用。
但是,出于两个原因,球队在追求更好的数据指标方面具有优势。第一个原因是球队有更多的资源让分析师们纸上谈兵,即使推测每一个回合该用怎样的防守目标显然是不可能的,但一位球队首席分析师说,至少它能够对自己球队的球员的防守能力有着一个基本的判断。
现在在为《The Athletic》撰稿的前雄鹿高管帕特诺说,“在公开场合,我们可以从非常详细的研究中找到一种推算方案,但是如果你能直接下楼去问录像分析组中的一个人,那就容易得多了。”
第二个原因是高级跟踪技术,因为团队可以接收Second Spectrum摄像机的全部输出数据,而公共分析人员只能检查NBA.com上发布的部分摘要数据。“我只想掌握原始的xy坐标数据,” 泰勒-斯纳尔笑着说说,他是预测正负值的创建者,也是爵士队的前分析师。“球员的跟追数据解锁了很多可能性。”
到目前为止,仅此而已:可能性。
球员跟踪技术可以提供大量数据,但是对于什么信息重要以及什么是随机噪声,不同的分析师有不同的看法。这意味着在选择如何建立一个全面的防守指标时,没有一个正确的答案。FiveThirtyEight的尼尔-潘恩说:“除了弄清楚其中的内容外,还有很多我们需要学习的地方。”他帮助开发了该网站的RAPTOR统计数据。
例如,一个数据指标可能会考虑当一个球员是对方投篮时最接近投篮球员的防守者时对手的命中率,但第二个指标可能会忽略该数据,认为要证明球队可以影响对手的三分命中率是一件非常棘手的事情,更不用说单个球员了。克里希纳-纳尔苏在2016年的一项调查分析发现,对于单独球员来说,在六英尺外,一切似乎都是随机的。然后,这两个指标就会因为他们选择包括的信息不同,而得出关于球员总体防守评价的不同,进而产生分歧。
在更广泛的调整正负值范围内,查看五个不同的高阶数据,我们发现不同数据对球员的防守表现有许多截然不同的评估。文章开头时提到的约基奇并不是个例,也不是最极端的情况。该图表显示了本赛季各个高阶统计数据之间差异最大的球员(每个球员至少比赛超过1,000分钟)。尤其是在为尼克斯和湖人的后卫防守分配功劳方面,这些统计数据似乎波动尤其大,前十名中有六名来自这两支球队:
(数据来源:真实正负值,RAPTOR数据,预测正负值,标准化调整正负值,LEBRON数据)
(数据解释:表格中数字代表百分位数,数字越接近100%,代表超过的球员越多,防守越好)
如何理解这些不同的数字,对于最佳阵容的投票者和那些预测下赛季排名情况的分析师来说是一个问题,但是对于未来取决于这些高阶数据的球员和球队官方人员来说,这个问题最为严重。
除了少数值得注意的例外,本赛季之前,鲁迪-戈贝尔签署了一份2.05亿美元的续约合同,联盟的顶级防守者通常不太可能获得大合同。人事主管说:“其中很大一部分只是因为我们不知道如何正确评估球员的防守水平。”
一个球员经纪人同意这一观点,他回忆起合同谈判时他试图推销自己客户球员的防守能力时,。他说:“我尝试量化其中的一些,但我无法完全量化。因为该信息不可用或未被广泛接受。优秀的防守者天生就被低估了。”
当球队制服组来决定向球员支付多少薪水时,缺乏准确和快速的防守评估也同样是一个问题。球员不是一成不变的,但是调整正负值的统计数据的稳定程度很低,这意味着很难确定结果的变化是由于球员真实的发展还是随着年龄的增长,或者仅仅是回归均值的变化。
对于那些要适应NBA的年轻球员而言,这个挑战最为明显。一个球队的管理人员问道:“如果一个球员在自己第二年打出了更好的高阶数据,那是因为他变得更好了,还是仅仅是统计噪音?这真的很难说。” 尽管承认在多个赛季中调整正负值在理论上是更好的,但这位高管指出,对于需要做出人事决定的制服组来说,它们在实践中没有什么用处。
“我并不总是有五年的等待时间来对一个人进行评估。三年级后,我必须签下他的新秀合同。”这位高管说,“我的意思是,对于那些专门研究防守的科学实验或大型研究论文而言,这很棒,但在现实生活中,我们没有那么奢侈。坦白说,五年来,我们可能都不一定干这行了。”
那么,分析师们包括公共和私人分析师,在衡量NBA防守时应该采取什么策略?消息人士称,先进的数据指标仍然具有一定的价值,因为现场观察和录像研究同样不够精确。有时候眼睛也会骗人,以至于一些球员被高估了,因为他们看起来好像很努力,但是其实是因为其本身防守能力有限,所以吃力的防守才使他们看起来很努力。有些球员可能会以细微,微妙的方式在防守端做出贡献,他们的努力是和团队努力分不开的,但只有在大型数据集中进行分析,他们才会引起注意。因此,为提出这个观点的分析师提供了一些更好的方法来评估单个球员的防守。
首先,使用“群体智慧”方法,就是指混合不同的指标以找到一个相同水平的平均值。“每个指标都球员被高估了。每个指标也都有被低估的球员。”迈尔斯说。“如果将它们全部放在一起看,希望彼此的不足可以抵消。” 如果有一个度量标准认为约基奇防守太糟糕了,有人认为他的防守属于平均水平,而有人认为他的防守很出色,那么他可能处于中等水平,接近平均水平。(约基奇本人同意!)
而且,如果所有指标都达成一致,例如与本赛季防守排行榜首位的戈贝尔一样,那么一致的态度应该会激发人们对该结论的更多信心。该图表显示了本赛季防守评分最稳定的球员。
译者注17:2020-2021赛季,各个高阶数据中表现差距最不明显的球员
(数据来源:真实正负值,RAPTOR数据,预测正负值,标准化调整正负值,LEBRON数据)
(数据解释:表格中数字代表百分位数,数字越接近100%,代表超过的球员越多,防守越好)
其次,尽可能多地关注球队的数据和球员本身的技能。想要知道约基奇到底是一个糟糕的,普通的还是出色的防守者,对于MVP投票者来说至关重要。但是对于球队来说,对于单个球员防守能力的判断通常不太有用,因为球员希望看到的是这个球员能不能融入自己球队的防守体系。例如,球队对大个子球员的要求更集中于护框和防挡拆的能力。
第三,与大学比赛相比,NBA分析技术的任何进步都是非常不容易的。“我们在大学球员身上所拥有的分析数据可能还比不上那些公开了好久的NBA球员数据呢。”一位高级球队管理人员这样说。
片刻思考之后,这位高管将大学防守统计数据的质量1-2分,满分10分。相比之下,就算NBA的防守统计数据是雾里看花,那至少NBA看的也是《蒙娜丽莎》。
最好的总体建议是,在评估球员的防守时保持谦虚的态度,包括统计数据,录像究,或者理想地将两者结合在一起。FiveThirtyEight的潘恩说,分析师必须以“世界上没有一种完美的评估防守的方法,你能做的只有无限接近。”
就目前而言,“无限接近完美”是我们能做的最好的事情,也许是永远的。一些分析师指出,先进的防守数据指标在过去十年中取得了长足的进步,他们不希望先发制人地限制未来几年可能会出现的新进展。但是,当被问及1-10分给现阶段的防守分析打分时,更多的消息来源说,他们认为在防守分析上永远不可能有“10分满分”的可能性。“可能我们会无限接近完美,”现在经营着Cleaning the Glass数据分析网站的福克说,“一旦达到某个极限,我们就不会变得更好。”
我们还没有达到这个极限,但是我们无法回避这样一个事实,即防守的核心问题实际上是无法被评估的。在防守方面,迈尔斯说:“真理永远不是一个单一的数字。”
永次郎的夏天
· 北京顶 这么好的文章怎么没人?