【梦剧场】足球数据小百科①—预期进球真就那么神?

avatar
关注

这两天简单收集整理了一些资料,感觉相关的数据统计的101解析,可能仅仅靠一篇内容无法完全阐述清晰,最终决定分为3-4篇内容进行展开,希望大家能够喜欢

1st 关于xG(预期进球)

2nd 关于进攻数据

3rd 关于防守数据

4th 哪里可以白嫖到赛后数据(Bye bye WS)


冷知识:第一份足球分析报告

第一份已知的足球分析报告可以追溯到 1950 年 3 月 18 日,当时一位名叫查尔斯·雷普 (Charles Reep) 的退休皇家空军军官记录了一份详细的记录,接受过会计培训的Reep,完整记录了他所在斯文顿镇比赛的全部事件。不过他并不想止步于此,利用他的财务背景,他通过所记录的数据对球队的比赛风格进行了分析,也有了著名的“三次传递以内的进攻,更容易进球”这样的论调,并且他也在自己的文章中写到“现在(50年代)流行的交叉传递组织,都是狗屎!!”

(被不少人誉为足球数据分析先驱的查尔斯.雷普,开创了当代足球分析的先河)

预期进球数(Excepted Goals)

基本定义——

预期进球是普通球迷广为人知高阶足球数据指标之一。 其最早运用于足球菠菜公司以及专业数据公司为用户提供更直观的赛事结果预测,现在已成为主流转播公司的常规数据(甚至包括游戏)。

预期进球(xG)用于分析比赛中机会的质量。每次射门都会被赋值,用以显示射门成为进球的机会。这个值基于关联射门的诸多因素,包括:射门位置、距球门的距离和角度、用于射门的身体部位(脚、头或其他)、进攻速度、以及射门最后一传的质量等。(在中线位置的射门更不可能成为进球。)xG可以帮助我们衡量球员在不同的比赛场景中进球的可能性,举例来说,球员在禁区内特定位置的射门机会价值0.1xG,这就意味着这样的射门条件下,预计10次射门可以获得1次进球。

(两份和我魔相关的数据分析,by TA)

如何计算——

在观看比赛的时候,我们自然可以判断射门机会是否最终转化为进球,包括观察射门员离球门是否足够近、是否从一个好的角度起脚(利足,逆足,身体姿态),是否是一对一?

而在xG的计算体系里,这些条件都被量化成最终影响xG的变量,以往赛事中数以十万计的同类数据被统计收集并被投入至回归模型中进行建模统计,才成就了看似简单实则极为精密的xG数据,以下是部分参考变量:>射门距离(Distance of the shot)

>射门角度(The angle of the shot)

>射门前时间及空间(Time and space before the shot)

>是否与门将1对1/周为是否有防守队员(1 on 1 with the goalkeeper if there were defenders around)

>射门部位(头或脚用来射门)Body part (shot using head or foot)

>助攻类型(直塞、横传、倒三角等)Assist type (through ball, pull-back, cross and others)

>进攻类型(阵地战、快速突破、角球、直接任意球、界外球等)Playing pattern (open play, fast break, corner kick, direct free kick, throw-in, and more)

>守门员站位(Goalkeeper's position)

>防守球员站位(Defender's position)

>是否利足射门(Footedness of shooter)

>防守队员向量(Defender's velocity and direction)

>击球部位及角度(Precise angle and location of the body part that strikes the ball)

>守门反应时间(Goalkeeper's reaction time)

>风压(Wind pressure)

>球内气压(Air pressure of the ball)——球充气程度

等等等等……(随着数据监测手段的不断完善,xG的数据模型也愈发的庞大)

众所周知比赛中也存在一些特殊情况,他们的xG会拥有单独的计算体系,例如球点球拥有一个恒定的xG值(0.79),而任意球以及头球机会在不同的场景下也拥有不同的赋值。


如何在观赛竞(bo)彩(cai)中使用xG——

(xG数据源于竞(bo)彩(cai),所以最好的应用也是在竞彩之中,所以这里的用途,主要以竞彩作为场景进行解析)

预期进球数可以使体育竞彩参与者获益,因为它提供了在最终比分中不能发现的比赛基本信息。 由于足球的低得分性质,一场比赛可能只有几个进球,最终的比分往往会误导不看比赛直播而光看赛后成绩与集锦的观(du)众(gou)。

例如:一支球队可能在比赛中占据了更多的控球权并创造了机会,但他们最终还是输掉了比赛。 这就是为什么基本进球数据(最终比分)不能代表比赛过程的原因,因此最终比分无法与比赛过程划上等号,也无法作为下场比赛结果的预(tou)测(zhu)依据。

而来自于比赛数据的xG数据基于更多的客观数据进行建模,可以更好的客观反映队伍的场上表现。 xG数据可以降低外部因素(非统计因素)对球队表现的所产生影响的判断偏差,更公平的展现球队表现质量。

预期进球数据可以帮助竞(tou)彩(zhu)者找到即将到来的比赛结果的估算。 当一个球队表现不佳或表现超过他们自己的 xG 指标时,他们通常会很快恢复到他们的平均指标。


xG是否准确?——

xG可以称为当今足球世界最热门的数据指标,而每个人都想炫耀自己的算法版本(对,不同数据公司或者个人分析师使用的xG版本,都有不同的模型和所采用数据),足球作为一项某种意义上的概率运动项目,不可能存在完美的量化模型,但是诸如英超等赛事所使用的xG模型,得益于oracle的算法以及opta的数据采集技术,其仍然能够达成高达90%的精确度。除了收集更多更精准的实时和历史数据,运气,始终会是足球运动最令人着迷的一点,也是xG永远无法预知的那一点。


结语——

xG虽然看似只是一个简单的数字,但是其背后,是复杂的变量+建模的组合,而且因为模型和参考数据的不同,同样队伍同样历史场次的数据会大相径庭,也希望通过此文,让兄弟们在使用xG数据时(不论是对球队,还是球员),不要单纯的就事论事,也要看一下数据背后的文章。


发布于上海阅读 29748

全部回复

discusser-avatar

中国人民的老牌友

· 浙江

谢谢兄弟,太顶了

亮了(0)
回复
discusser-avatar

MUDuck

· 山东

赞👍

亮了(0)
回复