高阶数据究竟针对了谁?高阶数据认为谁最名不副实?

avatar
关注

申明:本文不讨论高阶数据的有效性有多高。如欲讨论该问题,请去其他帖子,并且首先确保自己对高阶数据有足够了解,勿拿网络谣言当圣经。


如果能用一个数字来代表球员强弱,那可太方便了。这就是所谓的高阶(Advanced)数据/一体化(All-in-one)指标。虽然这是一个难以完成的任务,但90年代以来,不断有数据专家尝试。

总的来说,以RAPM为分水岭,可以把高阶数据的发展分为两个阶段。之前是经典高阶数据,之后是现代高阶数据。

本文不做太多科普,如欲了解RAPM,移步此文。https://bbs.hupu.com/57876048.html

简单来说,RAPM是一个不依赖任何基础数据,通过用数学方法处理正负值、直接算出球员影响力的高阶数据。RAPM回答的是球员到底有多强,无关乎数据有多牛。缺点是所需样本太大,无法用于单赛季,这是其他高阶数据不会遇到的问题。

经典高阶如PER,主要回答球员的基础数据有多牛。现代高阶如EPM、LEBRON、BPM,主要回答球员到底有多强,但混入了数据有多牛、以规避RAPM的缺陷。

现代高阶,由于引用了很多现代才开始统计的数据,无法追溯历史。经典高阶,虽然不如现代高阶可靠,但可以追溯历史,而且在中文网络的知名度高于现代高阶。


本文不讨论高阶数据的有效性(以后可讨论)。本文只讨论一个事实,高阶数据”针对“了谁(谁的名声和高阶数据不匹配)。由于高阶数据的重要性不断提升,与NBA最重要的奖项之一MVP评选高度挂钩,这个事实真相非常值得探讨。


以下是近年来,现代高阶数据(EPM、LEBRON、RAPTOR、RPM、BPM等)的前三名,以及MVP奖项前三名的对照关系。仅供参考,不是本文重点。


本文的重点是,把时间尺度放宽,看看在NBA历史的漫漫长河中,到底有谁被高阶数据”针对“了。因此,本文只能使用可靠性相对偏低的高阶:BPM、PER、WS/48。WS/48才是效率数据,WS是累积数据,因此只讨论WS/48。三者中,BPM相对更可靠。

网上流传着历年高阶第一的统计图。这类统计无法充分回答本文的问题,因为如果和乔丹、詹姆斯同处一个时代,高阶拿不到第一不代表不厉害、不代表被针对。

正因为这种图,导致网上出现了一些流言,比如:“魔术师也被高阶针对了”、“邓肯也被针对了”。这是一派胡言。

所以本文统计了历年的前三名,时间从1976-1977赛季开始(NBA和ABA合并)。统计图如下:


聚焦常规赛,样本更大,偶然性较小。

首先我们看第一名。可以看到,这3个数据的计算方法迥异,但”英雄所见略同”,没有任何1个赛季出现了3种高阶数据的第一分属3名不同球员的情况。

假设少数服从多数,可以得到各赛季(常规赛)高阶数据所认为的最佳球员如下:

上表中的球员肯定不能算被高阶数据针对。

从数量看,乔丹9,詹姆斯6,奥尼尔4,约基奇、罗宾逊3,J博士、贾巴尔至少3,伯德、加内特、诺维茨基、库里、阿德托昆博2。从MVP的吻合度看,已经连续11年完全匹配,今年有可能继续。上次不匹配还是在2010-2011赛季,詹姆斯面临两个Debuff,第一,加盟热火但战绩反而退步;第二,如果得了就是三连MVP。两个超级Debuff的加持下,詹姆斯仅排名MVP第三。再往前推,则是2007-2008赛季,这个赛季的MVP评选标准十分另类,以后会分析其中原因。


再看第二名。很少出现在第一、但经常出现在第二第三的就是被“高阶第一排行榜”所掩盖的球员,本文依次重点分析。

  • 魔术师:先后被伯德和乔丹压制。

  • 巴克利:被乔丹压制。

  • 斯托克顿:被乔丹压制。

  • 卡尔马龙:与其说被乔丹压制,不如说被奥尼尔压制。

  • 邓肯:被奥尼尔和加内特压制。

  • 韦德:被詹姆斯压制。

  • 保罗:被詹姆斯压制。但保罗是导致詹姆斯季后赛的色块不如乔丹完整的主要原因。

  • 乔丹、詹姆斯太可恶了?

上述球员也不算被高阶针对。


再看季后赛。可以用于识别季后赛发力的球员。

  • 奥拉朱旺:常规赛上榜较少,但季后赛上榜很多。

  • 伦纳德:常规赛上榜较少,但季后赛上榜较多。

  • 呆/软/硬:常规赛是软、硬高阶更好,但季后赛是呆、软高阶更好。

这几条都挺符合印象的。

季后赛高阶漂亮的球员,也不算被针对。


那么,谁被高阶针对了呢?这要看谁的名气大、历史地位高。下图是近年来权威媒体对NBA球员的历史排名情况。本文以ESPN的75大排名作为标杆,进行对照。


剔除1976-1977赛季前已经退役的上古球员,结果如下:


初步结论:本文认为,至少有2名历史级巨星被高阶针对,科比和伊塞亚托马斯。其中科比的历史地位显著高于托马斯。


那么如果考虑第4的情况呢?毕竟,以赛亚托马斯和乔丹、伯德、魔术师同处一时代。可以看到,托马斯第4的次数更多,在相对更可靠的BPM上则处于绝对领先位置(5比0)。托马斯的职业生涯也比科比短暂,上榜的机会更少。

结论:在本文所讨论的范围内,科比是最被高阶针对的巨星,高阶与历史地位最无法匹配。


(完)

湿乎乎的话题篮球数据帝詹姆斯理发店
发布于北京阅读 122050

这些回复亮了

discusser-avatar

铁铸罗汉楼主

· 北京
虎扑JR0650090932这事其实就是,你要说一个高阶和一体化针对你家哥哥了,那还有能讲的道理,但恒不能是所有的都不如,然后还硬说这个没用吧……收起

PER、BPM这种高阶真的想定制公式针对科比是很难的,因为科比的数据是一个破产版乔丹,针对科比的话也就针对了乔丹,而乔丹的高阶数据是历史第一

亮了(633)
查看回复(15)
回复
discusser-avatar

疾恶若仇

· 北京

这根本不需要分析,逛过虎扑的都知道答案,最多揣着明白装糊涂罢了。

亮了(353)
查看回复(4)
回复