[翻译团]哪项技术统计会从大学延续到职业赛场?

avatar
关注

深入研究业余和职业的海洋中进行研究

2021-22赛季的NBA已经接近了尾声,总决赛即将打响。然而对于尼克斯球迷来说,他们的心中则有一个完全不同的关注日期:即将在6月23日那个周四举行的选秀大会——这个日子距今已经不到一个月了!

作为《Posting & Toasting》的忠实读者,你们知道的,我一直在写去年发生了什么,谁做了什么,哪些球员前途光明以及其他各种各样的休赛期话题,包括选秀抽签和一些和选秀相关的研究。

关于最后一点:我又来写点东西了。研究并写出选秀球员的年龄如何影响他们在NBA中取得成功——或者黯然退场——让我产生了从不同的角度研究选秀的兴趣,我试图研究哪些数据是有效的,哪些是无效的。至少从历史的角度来看,这是因为选秀的确是一场赌博,我们都知道至一点。

我决定做一些非常简单的事情:找出一位球员在在进入联盟之前最后一个大学赛季和他菜鸟赛季的统计数据之间的相关性。我并没有仅仅进行简单的比较——将数据进行一对一的对比,比如计算NCAA和NBA的得分数据的相关性——而是建立起一个庞大的相关性数据矩阵,将所有的数据联系起来——比如将球员们在NCAA的场均得分和其他38个数据指标进行联系。

这背后的想法是看看在大学联赛和职业联赛之间哪些数据是有关联的。NCAA中的得分数据和NBA中的篮板数据由关联吗?在NCAA比赛中拥有高真实命中率的球员来到NBA后的抢断率会有相对较低的可能吗?是时候探索这些联系了。

我是用的数据集包含了2011-19赛季(因此采用的NBA数据来自于2012-20赛季)从NCAA联盟进入NBA的所有大学到联盟新秀的数据配对。

NCAA和NBA比赛之间基础数据的相关性

我想我们应该从最近本的数据开始,那就是当我们说起篮球的时候,看到的一直存在的最基本的统计数据:出场时间、得分、篮板、助攻、抢断、和盖帽。

简单做一下数据说明,两个变量之间的相关性范围是从-1.0到+1.0,-1.0表示完全负相关,0表示没有相关性,+1.0表示完全正相关。当一个变量严格随着另一个变量的增加或者减少的时候,二者之间就存在完美的正相关关系;反之,二者则符合完美的负相关关系。

记住这些,下面是这六个基本数据的相关性矩阵:

以下是图表中的一些要点:

-在NCAA和NBA数据中,盖帽数据的相关性最强,高达65%。

-助攻数据的相关性紧随其后,球员们最后一个NCAA赛季和新秀赛季的助攻相关系数达到了61%。

-剩下的相关性水平没有超过50%的,抢断数据的相关性水平排名第三,但是相关性已经"下降"到了47%.这三个数据有没有展现出强相关性(超过+0.7或者低于-0.7),但是他们都展现出了比较高的相关性(介于0.3-0.7之间)。

-但是最有趣的是那些看上去不相关的指标之间的相关性。NCAA出场时间越多的球员,在NBA中贡献的场均盖帽和篮板就越少,伟大的NCAA篮板手也有可能称为伟大的NBA篮板手...以及盖帽手。在助攻(NCAA)/抢断(NBA)方面的相关性也能看到类似的情况,二者的相关系数为37%(接近40%)。

投射数据的相关性

在NCAA和NBA比赛中,球员们每场比赛的技术统计水平差异非常大,此外还会受到教练使用以及球队角色的影响,因此,与其关注每场比赛的统计数据,倒不如关注命中率和使用率的相关性数据指标,以了解并预测一名球员在进入NBA之后的最高水平会是如何。

我从一些投篮指标开始计算,包括传统的投篮(投篮命中率%,三分球命中率%以及罚球命中率%),然后是一些新的投篮指标(真实命中率%和有效命中率%),这些数据可以更好地反映一个球员的投篮能力,计算结果如下:

我们再看一些重点:

-不管身处什么水平的比赛,优秀投手的发挥都一如既往的稳定。从NCAA进入NBA之后,投篮命中率的相关系数能够保持在40%,而40%的正相关性也是图中所有相关系数中最强的。

-类似的情况也发生在三分球命中率的相关性上(36%),而从NCAA到NBA的罚球命中率的相关系数只有27%(已经是弱相关了),相比之下,相关性水平下降明显。

-有趣的是——这一点已经从球探们的角度被广泛探讨过——NCAA比赛中的罚球命中率和职业联赛中的三分球命中率的联系很紧密,相关系数达到了27%。这本不值得拿出来说的,但是这个水平已经是剩下的所有相关性数据中相关程度最高的了。

-当讨论负相关的时候,投篮命中率和三分球命中率之间的相关性是NCAA和NBA之间最低的,一名球员在NCAA中的投篮命中率越高,那么他在进入NBA之后的三分球命中率可能就越低,反之亦然,罚球命中率的情况与之类似——球员在NCAA罚球线上的命中率越低,进入NBA之后他的投篮命中率可能就越高,反之同样如此。

比率相关性

我同时也认为关注一些比率数据会很有趣,因为这样会避免分均使用率偏差和数据失真的情况。这就意味着,我将不再仅仅关注场均助攻的数据,而是将注意力放在助攻率或者篮板率等统计数据上。这些数据计算的是当一名球员上场的时候的助攻率和篮板率等等。

为此我使用了传统的篮板、助攻、抢断和盖帽数据,外加失误和使用率,产生了以下相关性矩阵。

从相关性最高的数据中提炼出的一些要点:

-和基础数据与投射数据相关性矩阵相比,这个基于比率生成的小数据集展现了职业球员和NCAA球员之间球场表现最强的关联性。这不无道理,考虑到(比如),一个NCAA球队中最好的篮板手可能仍然会成为一支NBA球队中最好的篮板手。

-在数据一一对应的基础上,篮板率(正相关系数73%),助攻率(正相关系数72%)和盖帽率(正相关系数70%)符合这个预测。这是可以预见的,在过去十年间这个相关性甚至更高。

-有趣的是,抢断率在NCAA和NBA之间并没有展现出很强的相关性,虽然二者之间的相关系数是正的(符合预期),但是和其他三个指标超过70%的相关系数相比,抢断率的相关系数只有23%,处于非常低的水平。

-当把NCAA数据和NBA数据进行相关性检验的时候,抢断率是在表格中与另一个指标的相关性高于其本身的相关性的指标之一。尽管很接近,但是抢断率和助攻率的相关系数(28%)比其与自身的相关系数(23%)要高——这表明一名球员在NCAA的抢断率越高,他在进入NBA之后的助攻率就越高,反之亦然。

-负相关的指标表明,球员从NCAA进入NBA,意味着他成为了一名职业球员,那么他就会变得更加专业。这一点在篮板率和助攻率之间的相关系数上表现得最为明显:在NCAA中篮板率或者助攻率很高的球员在进入NBA之后,这两个数据之间的相关性成很强的相反性。这可以理解为,球队希望那些上场抢篮板的球员专注于争抢篮板球,从而他们的助攻数就随之变少,反之亦然(伟大的NCAA助攻手进入NBA之后就会把争抢篮板球的任务从他们的任务清单里面删除)。

-那些在NCAA锦标赛中有高使用率的球员们倾向于在NBA中保留类似的角色。当然这二者之间的相关系数勉强达到了中相关性(32%),因为新秀就是新秀,尽管他们都是NCAA各支球队中当仁不让的明星。但是数据显示了这些球员在这个过程中足够高的相关性,让我们看到在NCAA中得到重用的球员们更容易在他们在NBA的第一个赛季中受到重用。

进攻/防守/整体表现相关系数

最后,我计算并绘制了球员们进攻和防守之间的相关性,以及他们从NCAA进入NBA过程中的效率转变。结果如下:

从中可以看到:

-防守效率(DRtg)的相关程度比进攻效率(ORtg)的相关程度高很多,从NCAA到NBA,球员们的进攻效率相关系数为+13%,而防守效率相关系数是进攻效率的两倍还多(+28%)。

-NCAA中具有NBA前景的球员们的进攻效率和其在NBA中的进攻表现成正相关,但是和他们的防守表现无关(相关系数为0,完全无关);而防守效率则不一样,它具有最强的对应正相关性,但与进攻效率成负相关(虽然只有8%的负相关系数),这意味着一名球员在NCAA中的防守效率越高,他在NBA中的进攻效率就越低,反之亦然。

-虽然球场效率不是衡量球员在篮球比赛中整体影响力最值得信赖的指标,但是它也是一个可以快速了解谁对球队贡献最大的很好的统计数据。事实证明(大部分情况下都应该是如此),在NCAA中球场效率高的球员们在NBA也是如此。糟糕的是,我们都知道NBA选秀实质上就是一场赌博,所以这两者的相关系数也只有30%。

完整的相关性矩阵

对于你们这些数据迷,我在这里放上完整的相关性矩阵,如果可以的话,建议你们用最大的尺寸打开它,或者直接保存到设备上来更好地浏览它,虽然我觉得这不太可能发生。

* AVG代表NCAA数据和NBA数据的平均相关系数,ABS代表AVG的绝对值。


虎扑篮球翻译团招新啦~

不管你是对NBA球员的故事感兴趣,还是想了解主队的幕后故事,又或者想了解高深莫测的篮球战术,探讨天马行空的交易方案,磨炼自己的英翻中功底等等等等,都欢迎来虎扑篮球翻译团参与翻译事项!这里有很多海量好文在等着你~

招工发布处:翻译团招工部

完工译文发布处:翻译团lounge/篮球翻译团

更多相关事项欢迎点击阅读:翻译团招工部接工简明指南&退稿和窝稿处理细则(新人必读!)

阅读 29726

全部回复

discusser-avatar

用那么好名字干嘛

· 广西

“-在数据一一对应的基础上,篮板率(正相关系数73%),助攻率(正相关系数72%)和盖帽率(正相关系数70%)符合这个预测。这是可以预见的,在过去十年间这个相关性甚至更高。-有趣的是,抢断率在NCAA和NBA之间并没有展现出很强的相关性,虽然二者之间的相关系数是正的(符合预期),但是和其他三个指标超过70%的相关系数相比,抢断率的相关系数只有23%,处于非常低的水平。”mark一下~

亮了(0)
回复
discusser-avatar

加菲猫fly

· 北京

“-类似的情况也发生在三分球命中率的相关性上(36%),而从NCAA到NBA的罚球命中率的相关系数只有27%(已经是弱相关了),相比之下,相关性水平下降明显。-有趣的是——这一点已经从球探们的角度被广泛探讨过——NCAA比赛中的罚球命中率和职业联赛中的三分球命中率的联系很紧密,相关系数达到了27%。这本不值得拿出来说的,但是这个水平已经是剩下的所有相关性数据中相关程度最高的了。-当讨论负相关的时候,投篮命中率和三分球命中率之间的相关性是NCAA和NBA之间最低的,一名球员在NCAA中的投篮命中率越高,那么他在进入NBA之后的三分球命中率可能就越低,反之亦然,罚球命中率的情况与之类似——球员在NCAA罚球线上的命中率越低,进入NBA之后他的投篮命中率可能就越高,反之同样如此。”这段分析的不太好,fg% 分为 2% 3%,在中锋这个点上会出现明显差异,到了NBA职责明确 中锋吃饼 2%效率越高的同时,三分线扩大 3%效率会变低。另外罚球不好的中锋,也会因为分工的明确2%效率得到极大的提升。而不是笼统的将 两个位置 中锋和外线混为一谈的做数据统计,fg% 2% 3% ft% 差别还是很大的。

亮了(0)
查看回复(1)
回复