关于WhoScored打分,一些猜测

avatar
关注

数据首先要取得。热图有可能通过穿戴传感装置取得,也可能通过高位摄像机。但技术动作的完成,很难认为仅通过机器能识别,就必须有人统计,然后按预设分类放到机器里,机器再加权打分。

WhoScored(简称为WS)绝不会仅根据网站列出的较常用数据打分,一定有背后不常用/不通用/不泛化的细项数据。否则有些结果无法解释。

今天比赛中,恩凯迪亚所有数据均为0,但比有数据的厄德高多0.02分。我不认为这个小数点后两位没有意义,如果没有意义为什么它会写出来呢?

Whoscored的标准,上场即6.0,有正面统计加分,有负面统计减分。虽说它也说替补球员时间不长的不算入评分,但这更像是评分不具备明确参考性,而并非完全没有评。

比如:

曼联对谢联的比赛,

博格尔看上去是个未计入评分。

实际上,

他52分钟替补上场,相对于默认分是负0.05分。

阿森纳对南安普顿的比赛,

南安两人73分钟上场,被扣了分,威廉71分钟上场,加了分。

显然这些人都评了分。而回到恩凯迪亚这里,一个绝对为零统计的人,为何得到了0.02分。我只能猜测为,WS认为他在有效区域进行了跑动,给了分。厄德高或许是中场的区域跑动给分权重没有前锋高,也或许有1次丢失球权的统计,使得他3触球2传球的表现反而累积没有恩凯迪亚高。

所以我认为,WS有跑动区域打分(机器),有数据统计打分,有关键表现打分(人工)。

特别是今天卡瓦尼的表现,5.89,全场比赛并不觉得他差,当然由于曼联全场控球时间较多,卡瓦尼更多在禁区里等传中,拿不到什么大范围活动和配合的分数,但也不太像能让机器打出低于合格分,只能认为是人工给他两次错失好机会扣了分。

我认为按细分区域的统计数据打分,作为数据机构是合乎逻辑的,这样的数据不会公开,公开的只是总数。观众关心的也是最终出来的评分是否合理,至少符合观感。总的来说,WS的分也有越来越符合观感的地方。

而有些球员表现,尽管观众印象不佳,WS给了不差的分,理由应该是活动于有效区域,有数据累积,没有大的负面统计。有些球员打满全场,没功劳也有苦劳,只得到不好的评分,应该是有效区域活动不多,数据积累有限,有负面统计。看上去负面统计扣分似乎更容易些。比如说,阿森纳4:0西布朗,西布朗有3人低于6分;而利物浦3:1热刺,热刺5人低于6分。热刺打得差也没有那么差,只能理解为负面扣分重。

发布于上海阅读 16079

全部回复

discusser-avatar

拉姆塞今天专注了吗

· 江苏

实际贡献也是需要量化来衡量的,不然就会出现各说各理,各有各观感的问题。在这个前提下科技手段的评分是非常重要的。ws之所以经常被诟病,倒不是因为数据打分是骗人,而是各项数据权重不平衡,这就出现了梅西没什么作为却靠着突破成功率和传威胁球就能拿10分的争议情况。如果是按照看球的观感,也有比较有权威的评分,比如天空体育。但是天空体育的评分经常不合球迷的胃口,例如经常给扎卡高分。

亮了(1)
回复
discusser-avatar

拉姆塞今天专注了吗

· 江苏

教练层次是更需要数据的,相反我们这些球迷只是看数据图个乐。现在每个俱乐部都花大钱买数据,一方面评估本队球员的场上表现和身体机能,一方面对买人提供帮助。比赛录像也是需要的,不过能看一个球员的比赛录像去研究,很多情况下是已经被数据筛选过一遍的。两者对于现在的职业足球都很关键。

亮了(2)
回复