【翻译团】“低数据全明星球员”:成为核心非要华丽数据不可?未必!

avatar
关注


John Muller / 2021-12-21 


在上周末狼队和切尔西的比赛中,狼队中后卫兼队长康纳-科迪(Conor Coady)在禁区弧顶完美封堵了普利西奇的一次空位射门,也许也是因为这次精彩的封堵,狼队才能逼平切尔西。可惜的是科迪落地时扭到了脚踝,不得不被搀扶下场。


在比赛重新开始后,电视评论员表示,很少看到狼队在没有科迪的情况下继续作战。本赛季,科迪已经足足出场了1788分钟联赛,几乎是满勤,甚至还踢满了英格兰的三场世界杯预选赛。


然而如果你只是个Excel球迷,你或许很难理解,为什么科迪这种数据的中后卫居然还有人坚持用他打主力。就拿这场比赛来说,科迪除了导致受伤的这次铲球外,没有其他铲抢数据;没有断球数据,啥也没有;就连传球,也几乎都是向边路转移的,看上去啥也没做。


再从FBref球探报告中拉一份数据看看吧。科迪的数据依然不太入眼。你看到的满是短短的红条——相比于其他中后卫,科迪的传球数在英超后卫中排第29,铲球数排名第6,防守强度排名第4,断球和争得头球数也就算是第一梯队。


这么说吧,光看数据,狼队有科迪没科迪也没什么区别嘛。


然而,英超赛场上就是有这么些“有他没他都一样”的球员。这些球员好像球烫脚一样双脚不沾“阳春球”,却又总是能踢满全场。这就让数据分析人员犯了难:明明他们啥都没做,数据也不怎么样,怎么偏偏就成了不可或缺的核心人物?


《Moneyball》的作者迈克尔-刘易斯(Michael Lewis)为这样的球员起了一个新名词:“低数据全明星”。这个名词是他在写NBA球员巴蒂尔时创造的。巴蒂尔对球队的贡献往往无法体现在传统的得分榜上。“在篮球的历史上,他们不是拿重要的东西去评价一个球员,”刘易斯写道,“而是拿容易看到的数据,比如得分,篮板,助攻,抢断,盖帽这种来评价一个球员,这很大程度上扭曲了人们对体育运动的看法。”


至于足球数据,大部分是采集自有球数据,或者说,“碰到皮球才有数据可采”。通过这些数据而不是个人回忆,我们可以更好地复盘比赛,也可以采用更多的数据源,但这些数据依然会漏掉许多重要的细节。有些球员的触球或许扮演着极为重要的作用——有的时候甚至完全无球——这些都是数据不能告诉我们的。我们需要更深入研究这些情况,才能更好地了解这些“爱挂蛋”的球员是怎么牢牢把握主力位置的。这不仅能让我们更好地理解各种分析报告中的数据,更能指出未来数据研究的方向——我们需要看出球场上更重要的是哪些部分。


一个几乎不铲抢的后卫,一个几乎不传球的中场,一个除了进球时几乎隐形的前锋。这些“低数据全明星”其实无处不在。


后卫:康纳-科迪


科迪(Conor Coady)可能是足球数据分析师最头疼的研究对象。一般而言,大数据会认为一名中后卫要么像狗一样对猎物紧追不舍,要么像猫一样选位敏捷灵巧。然而单从数据中去分析一名球员有球时的防守质量,这可是难如登天。


比如范戴克,大家都觉得他就是利物浦后防线上的移动堡垒,然而他的数据却和科迪不相上下——无论是防守强度,铲抢,还是断球,看上去都像是个英超末流后卫;而他的拦截和解围数据也毫无亮点,似乎是个球员只要稍微有点防守意识就都能做到这些。然而大家都说范戴克是英超最佳后卫。既然范戴克这样的顶级后卫也“只能”交出这样的数据,那么我们统计的这些数据又能说明什么呢?


也许其中一个原因是表现机会。利物浦的高压逼抢战术使得他们更多地在前场就能反抢下皮球就地发起进攻,高大的范戴克在后场狠狠瞪一下对方进攻球员也足够让他们脚软一下。然而狼队的整体能力没有那么强,对手更容易得到机会,因此狼队主帅布鲁诺-拉赫(Bruno Lage)设计了五后卫的“防守链条”。虽说科迪是防线上的“最后希望”,但拉赫还是要求球队尽可能不要让科迪“陷入麻烦”。科迪的中卫搭档则会前移进行阻截和铲抢,除非他的搭档们双双“失守”,科迪是不会贸然上前的。而科迪上前拼抢时,产生的数据却可能并不体现在他的防守数据中。


就拿这场和切尔西的比赛来说吧。当芒特丢失球权的时候,身后的罗曼-塞斯(Romain Saiss)跟了上来,却在本方左侧防线留出了一道口子。坎特迅速朝着空档插上,然而科迪观察到了坎特的跑位,迅速跟了上来。科迪的逼迫刚好让坎特无法朝着边线继续前进,而是把球用脚后跟尝试敲回给芒特。



最终狼队重新夺回了球权。虽说的确是科迪的防守使得坎特出现了传球失误,但这次防守中科迪完全没有触碰皮球。单纯的比赛技术统计数据根本不会指出科迪在本次防守中的重要性。


有的时候,甚至于积极的铲抢都未必会被算作防守数据。比如下面这个场景,科迪机敏地看到普利西奇就要从身后追上来了……




因此普利西奇尝试在最后时刻强行从科迪的一侧超车……


但科迪“预判了普利西奇的预判”,冷静地截下了切尔西球员的传球。


人工记录球员数据的时候不免将自己的主观认识带入,因此Stats Perform记录的数据中,科迪增加的只有一次成功传球而不是一次断球。如果没有谨慎仔细的控球分析,科迪的这次教科书般的防守就和其他球员一次漫不经心的传球“沦落”到一个档次。


正是因为有这样的情况存在,所以在调整球员的防守数据时要考虑的问题太多。像“创造机会”这个数据,只要减掉对手的控球比例或者触球次数就行,防守数据能依样画葫芦这么做吗?嗯,有时候可以,但多数情况下不行。在美式橄榄球中,有一个术语叫“封锁角卫效应”(shutdown corner effect),意思是这名角卫的防守极其出色,对手看到他就只能把球传到其他地方——足球这里就不一样了。像科迪这样的防守微操,都很难用什么“效应”来形容,甚至于很难用简单的词汇来描述。


因此,数据分析师们选择不去看后卫们“赢得球权”所创造的数据,转而研究防守球员在面对对方的进攻时,进攻球员对该防守球员所应负责的特定球员或区域造成的危险程度来衡量防守质量。比如说,我们都知道科迪在和切尔西的比赛中只做出了一次铲断,但这个数据的重要性却不如普利西奇全场只有一次射门来得重要。这样的推演使得足球更加有据可循,但实际上,在统计数据中将每名球员的“防守责任”具体化可并不容易。


“在比赛统计数据中,你很难精准地辨别出后卫在一次进攻中的作用。”SmartScout的发言人说(SmartScout是TheAthletic各种数据饼图的提供者)。SmartScout已经竭尽所能优化算法并通过视频验证的方式以期“预判后卫球员的每一次行动”,然而他们仍然对科迪束手无策——在过去的4个赛季中,科迪的数据怎么算,防守质量都只能得到12分(基数为100),甚至于4年来他的防守(行为)得分年年都挂蛋。


当然也有这种可能,数据是对的,科迪就是挺菜的。但狼队18场比赛只丢了14球,科迪也入选了英格兰国家队,这总不至于是索斯盖特和他的团队都眼瞎吧?如果没有无球跑动追踪数据在防守指数方面的支持——就算有估计也是一样——我们很难衡量像科迪这样几乎不触球的中后卫对团队所做出的贡献。




中场:康纳-加拉格

水晶宫中场康纳-加拉格(Conor Gallagher)不像科迪这样几乎不触球,他90分钟的平均触球数还是有52.8次的——还是过了平均线。但你要知道,维埃拉治下的水晶宫特别强调传控——而在下图中,加拉格的场均触球比例(Adjusted Touch Share)足足落后了89%的球员……所以我们要说说像加拉格这样的球员有何作用了。



虽然我们不怎么见得到加拉格拿球,但他却是水晶宫中场球员中出场时间最多的。也让我们欢迎他加入“低数据全明星”俱乐部。


不过,我们这里的问题不是如何衡量防守数据。加拉格似乎是“疯跑抢断流”,本赛季的数据统计中,加拉格的铲抢、断球和阻截数据在“每百次争抢球权尝试”榜上超过61%的英超中场,成功给对手造成压迫数据也在该榜上超过了89%的同侪。不同于科迪,他的数据精于“无球对抗”。


但你也不能单纯的认为加拉格就是一个纯工兵中场。他每场平均可以为球队创造0.43球(只含非点球进球和助攻),这一数据强过94%的英超中场球员。数据统计明确地指出加拉格这位炙手可热的新秀在攻防两端都有亮眼表现,也无怪于本站一资深专家甚至认为他是英超第四好的球员。


只不过加拉格入选本俱乐部的原因有所不同——他几乎不做我们传统认知里中场做的事情:传球。就目前我们采集到的数据而言,加拉格甚是符合以下迷因所述的中场:


加拉格的数据最有趣的地方在于,我们传统观念中十分重要的那些(进球+助攻)他都交出了不错的答卷,同时却又把一些难以评估的指标压缩到了最低。


目前,足球数据分析的最新潮流是使用“控球价值”模型。该模型会计算球员的每一次触球对球队得分(有时是丢球)机会的影响程度,这听上去很像适用于球场上任何位置的“预期进球”参数。毕竟“预期进球”很好理解:一般而言,越是把球往对方的球门赶,你就越有可能得分。


而美式橄榄球则有一种更复杂一些的指数,即“贡献进球”指数(Goals Added Metric)。该指数通过测算球员每次触球时周围的控球环境来计算当时更精确的潜在进球概率而不局限于球的位置。在一些高端局里,球队会使用最佳控球价值模型。他们使用即时跟踪数据,每秒都会计算多次关于不同方向的传球和无球跑动能为球队带来的价值。


然而,即便你欣喜若狂地抱回上文所述的这个数学模型,想要尝试用它来解决加拉格的“中场难题”,你或许又会失望。毕竟,中场的每一次选择会导致什么结果,都很难预测,甚至于一次传球或是一次失误之间的差距都可能极其微小——毕竟需要太多太多偶然性因素堆叠起来,才能让中场球员的一次控球最终转化为进球。所以,算到后来,还是后卫和前锋的统计数据最多,而中场的数据则经常容易挂蛋。StatsBomb的分析员托马斯-劳伦斯(Thom Lawrence)戏称:“光看数据,谁特么的会在乎中场呢。”


当然,这不是说中场球员就真的不重要了,或者说中场球员之间没有什么差别。除非你能开发出一种数学模型,可以分辨出以下边路转移球的区别:


比如在攻防转换中加拉格遇到逼抢,只能把球挑传边路,只求越过防守球员的大腿……


还有这个传球,似乎和其他传球毫无区别,然而加拉格在吸引了两名防守队员后,为边路的队友创造了空当……


通常而言,中场球员的长短板有的时候会和队友“互换”或是“互补”从而难以分辨。不过对加拉格而言,他可不是单纯的疯跑流,他的价值更多体现在进攻端的跑位上。有的时候,他的跑位能为球队带来进球和助攻;有的时候则能为队友创造杀机,令对手难以设防:


总的来说,虽然加拉格的触球次数相比其他队友要少,但他触球就能制造杀机的能力要强于多数中场球员——他也能最大化利用这些机会。迈克-因布尔吉奥(Mike Imburgio)的“戴维斯模型”(DAVIES Model)使用公开的 FBref 统计数据来估算球员们为球队“增加进球”的价值,而加拉格在欧洲顶级联赛的U23球员中排名第6,仅仅落后于勒沃库森新秀弗洛里安-维尔茨(Florian Wirtz)。所以一名球员不传球或是无法传球或许也不是坏事?



前锋:瓦尔迪


有些数据不说你也看得出代表了什么。FBref的报告指出,瓦尔迪的所有触球中,3.3%最终化作非点球进球——这个数据甚至好于莱万,哈兰德,仅仅落后于希克。一个前锋应该有多少触球数是个挺有意思的问题,但既然瓦尔迪在圣诞节前已经有9球入账,你还会关心他到底触球了几次吗?


今年已经34岁的瓦尔迪首发了莱斯特城11场联赛中的9场。其他前锋若是有这么多的出场机会,或许会在除了进球以外的数据上也贡献一点。不过,瓦尔迪并不经常回撤和队友做配合,他更多的贡献体现在进攻中的无球跑动上。


比如对阵沃特福德的这个进球。瓦尔迪起初在左肋部稍显越位的位置站定,此时左后卫卢克-托马斯(Luke Thomas)截得皮球迅速前插。然而此时的瓦尔迪并不急着前插,反而往回挪了几步,带走一名中后卫。托马斯的身前顿时出现一片开阔地,于是他立刻传出一记弧线球给阿德莫拉-洛克曼(Ademola Lookaman),后者最终破门得分。


而下面这个和诺维奇的进球几乎和前面这个如出一辙。托马斯也是在左路拿球,瓦尔迪在对方边后卫和中后卫之间游弋。这时候他们中间没有其他本方队员,于是瓦尔迪突然内切,为后面插上的詹姆斯-麦迪逊(James Maddison)撕扯出了一个空当。


接着,瓦尔迪又突然回撤,接下麦迪逊的传球,大脚转移给右边快速插上的马克-阿尔布莱顿(Marc Albrighton),又刷了一个助攻。


瓦尔迪在这两个进球过程中其实都没动几步,然而正是因为他从合适的位置启动,迅速完成正确的跑位,才能为队友创造空当,并最终为球队的两次得分立下汗马功劳。这种四两拨千斤的跑位和触球可以说是难得可贵。


当然,瓦尔迪的助攻肯定是被数据收录了,然而他的跑位和对对方后卫的牵扯却又是数据无法收录的。这就是前文所述的如何衡量防守质量的“镜像问题”——如何衡量进攻中的无球跑动数据?我们需要新的工具。


不过这里有个好消息。进攻球员的无球数据一般比防守球员的无球数据来得吃香。比如专供战术分析的油管频道负责人Friends of Tracking兼Soccermatics的作者大卫-桑普特(David Sumpter)就开设了一家名为Twelve Football的公司,专门使用这样的数据来提供球探服务。


从Twelve Football的数据中我们可以看出,瓦尔迪不仅在进攻跑位选择上排名前20%,就连未能成功传给他的传球,他的跑位选择也比80%以上的球员更加出色。瓦尔迪撕扯对手防线的能力使得他无论是否持球,对手都得忌惮三分。虽然他的跑动为队友打开空间的能力和英超平均水平差不多,不过你也不能对一个34岁的老将要求太高不是?


看完这三个球员的分析,你就会知道,无论是什么位置,“低数据全明星”都能让我们知道,光看Excel评价球员有多不靠谱。


我们当然可以通过调整我们取得的数据为这些球员赋予更好看的数值。我们也可以从新的控球价值模型中挖掘出更多东西,通过“潜在进球概率”来衡量球员们的每一次触球。然而,若要完全理解这些“低数据全明星”在场上场下展现出的一切,我们要看的又不仅仅是他们的触球,而要学会纵观整场比赛,综合判定。


毕竟,重要的数据和容易收集的数据,它们也不总是有交集。


https://theathletic.com/3028824/2021/12/22/introducing-the-no-touch-all-stars/


翻译时间:2021-12-26


虎扑足球翻译团是一个聊球、八卦、学外语的有趣团体,只要对语言有一颗热爱的心,虎扑翻译团就欢迎你的加入

https://bbs.hupu.com/35323629.html




足球话题区翻译团文章
阅读 133978

这些回复亮了

discusser-avatar

原始交锋

· 广东

文章是很专业的

亮了(104)
回复
discusser-avatar

风二叔

· 广东

你这意思我评价一个球员还得亲自去看比赛?那我不就没时间高速冲浪了?🐶

亮了(74)
查看回复(1)
回复