【JR原创技术贴】Python分析谁是NBA本赛季焦灼战第4节的最强球队
JR们我又来了,持续创作篮球数据分析文章是我作为一个数据分析师工作之余的兴趣,先感谢JRs的支持
前两天看到网区一个帖子,勾起了我对联盟比赛第4节数据的好奇心
篮网在主场领先进入第四节的比赛,没输过为了尽可能纯粹地分析出在焦灼战中第4节哪支球队发挥更优,从而收掉比赛胜利,于是我将分析的比赛范围做了如下限制(简记为规则A):
1>【前3节比赛打完后,两队分差在5分以内(含)】
2>【剔除加时才分出胜负的比赛】
3>【统计数据截至2021-04-28】
限制以上规则是为了将前3节两队分差缩小至2个球左右的差距,此时可以近似地认为两队在前3节地竞技状态接近(注意这里不是球队的真实实力,所谓NBA无弱旅);减少分差过大时两队大面积阵容调整的影响
基于此,我爬取了20-21赛季球队&球员的每场比赛数据(by period),做了一系列数据处理,最终用python可视化了如下的大图(文末附代码)
横轴X为进入第4节时分差5分以内的场次(规则A),纵轴Y为对应的球队胜率,可以看到篮网打此类比赛不仅数量多(22场),而且胜率极高:达到81%;往下一个梯队是西部前2:爵士和太阳;顺便tx一下活塞
PS:为了找好看一点的球队logo,我专门找了svg矢量图,费了一番功夫用python转为尺寸统一的png格式
接下来就来分析篮网球员的数据,爬取网队球员在规则A下比赛的第4节表现,并剔除了在规则A比赛中第4节从未得分的球员(这里respect所有球员,仅出于统计需求)。
先看表再看图(规则A下第4节场均数据),由于出赛季中期存在交易,因此不论球员当前是否还在主队,只要参与这些比赛第4节的球员数据均会列出
命中率&得分(含已交易球员)
篮板&助攻(含已交易球员)
上场时间&正负值(含已交易球员)
从图中可以发现在规则A的比赛中:
1> 第4节阿杜可以高效砍下8.7分,命中率达到61.9%,由于助攻数并不突出,可见主要的得分方式就是巨星单打,硬解能力的优势再季后赛中更会被放大。
2> 登哥第4节得分不遑多让也能拿8.4分,单节就可以助攻2.9个,篮板全队最多3.5个,同时第4节几乎打满(场均11分钟),扛起了球队组织和进攻的半边天。这里我顺便统计了一下这些比赛中哈登全场场均出手17.6次,单第4节就出手6.9次,占比近40%
3> 三巨头之一的欧文也能砍下5.4分,单节命中率43.9%, 印象中欧文还是打了很多场好球且效率很高的,所以我拉了这些比赛的数据来看,其中有两场比赛加起来只有1次出手,没有得分,所以平均分被拉低 (所有的球员数据计算口径是只要第4节上场就会计入);另外也不排除欧文打的好的比赛很多都花了,所以较少分布在预设规则中
图中date为美国时间(相比国内时间-1),pts为得分,fga为出手次数, trb为篮板数,ast为助攻数
4>小MJ最近几场表现很猛啊,助攻、效率、正负值都杠杠的。
5> 再看一个数据,这些比赛中联盟第4节的平均得分是27分,而杜哈欧+乔哈得分=8.7+8.4+5.4+5.0=27.5分
这还不算最近MJ的高效表现+布朗偷鸡+沙丞相的自信跳投+姐夫、格里芬、阿德的稳定发挥...
当然了,不能直接把每个球员的得分之和简单的相加就认为是球队第4节的得分,毕竟每场比赛排兵布阵不同且每个球员在场时间不同(高手再多,场上最多也就5个人),但这些数据足以说明焦灼战中篮网的取胜和其高效的进攻火力是相关的
关于防守的解析,需要考虑对位球员和防守策略的问题,后面有时间我会再写一贴来细说
【图1 数据处理部分代码】
注:本贴为作者原创文章,禁止任何形式转载,喜欢数据分析的JRs 欢迎关注作者唯一ID(仅为HUPU账号):场边的泰伦卢
场边的泰伦卢楼主
· 陕西附一个同规则下太阳的,老炮稳啊
没有好名字了吧2
· 四川如果要出哈登的话建议从17赛季开始,17之前和现在打法完全不一样了没有参考价值,哈登虽然季后赛存在拉胯,但是如果和其他球星面对同一球队的对比,实际上十分不错,除去19面对勇士的34.8,还有18面对勇士30,20面对湖人29.5,而其他巨星比如利拉德面对勇士时场均只23-24分,命中率40%,哈登的拉胯比例也没有想像这么大,18赛季保罗受伤后俩场比赛依旧30+,19同样,20面对湖人命中率47%+70%内线命中率,德安东尼来后,哈登最被人记住的还是面对马刺的拉胯。还是希望lz出一个哈登季后赛所面对的防守资源和强度,进攻带动包括带动队员,以及横向比较同为后卫里面,其他后卫和哈登的季后赛表现对比,爱了,点个推荐