【数据分析】用xG衡量纯射门能力,孙哥封神
今天分享一个自己做的数据分析,目标是评估当下顶级前锋们的纯射门能力。
以前媒体一般是用进球数和射门转化率,也就是进球数除以射门总数,来衡量一个射手的射门能力。但是这个方法有明显的缺点:获得机会多的前锋,特别是强队的前锋,进球数一般会比较多;喜欢在禁区里活动的前锋,获得的机会往往比较好,比起有事没事抡一脚远射的球员,射门转化率肯定要高许多。不同球队、不同类型的球员,很难放在一起去比较。
不过,自从进入了xG时代,我们可以得知每一脚射门的预期进球概率了。那把某个球员在较长一段时间内的总进球数,和球员的总xG(每脚射门的xG之和)进行比较,就能够很快得知他的进球水平是超出预期还是不及预期了。
举个例子,上个赛季莱万在德甲34场比赛的总xG是32.08,实际上进了41个球。这个32.08的总xG,和队友的传球准确度、对手的防守压力、莱万自己的跑位有关系,并且在莱万出脚射门前,xG的值已经确定了。换句话说,xG这个指标,恰好帮我们排除了和射门无关的所有因素,32.08的xG最终能转化为多少进球,只与莱万的射门能力有关。(与守门员的水平其实也有关系,不过我们假定守门员不会只针对一个人超神)
按照(进球数除以总xG减1)的公式,可以为莱万上赛季的表现算出一个超额收益率:0.278。这个0.278的含义是:莱万每获得价值1 xG的机会,就可以比一个五大联赛平均水平的球员多进0.278球。接下来我会用这个超额收益率来评判球员的纯射门能力。
我抓取了2014-15赛季开始,到2021-22赛季10月国际比赛周之前为止的所有联赛比赛数据,筛选了一共68位球员。这些球员在统计期间内,共计打入至少60球,或者至少积累了60 xG。按照超额收益率从高到低,排行如下:
可以看到,孙哥豪取第一,而且离第二名大阿扎尔拉开了不少的差距。
————分割线————
我们还知道,扔5次硬币5次朝上,可能是偶然情况;扔500次硬币500次朝上,那大概率是作弊。可以说,样本量越大,即射门次数、进球数越多,保持特别高(或者特别低)收益率的难度也就越大。下面是一张结合了总进球数的二维散点图。
可以看到,进球越多的球员,超额收益率的分布就越紧密,出现极端值相比更难。
想看哪位没有出现的球员的数据,或者某位球员具体到左右脚、射门位置、定位球或运动战的详细分析,可以回复留言,我会尽量回答。如果这种分析各位喜欢的话,后面也会多出几期。
杜拉斯的情人
· 黑龙江综合看射门效率和进球数,梅西还是yyds
坚决铲除错误译名楼主
· 浙江欢迎讨论,你说的情况我也思考过,如果衡量综合能力是会有一定问题,所以最后只是看纯射术。其实c情况下,被后卫干扰的程度,也体现在xG的计算模型里了。只要形成了射门,就会有一个进球的概率,哪怕这个概率因为干扰变得比较小,按照数学期望的定义,多形成几次这样的机会,正常情况下还是会产生进球的。假设这个场景下概率是1%,形成了100次这样的机会正常就是要把握住一次,如果一次都没把握住,在射门能力的评价上确实是会有负收益,我觉得也是合理的