介绍一个基于Wyscout数据的免费网页工具(含300+男女足各级联赛)
先上链接:https://best11scouting.streamlit.app/
best11scouting发布于24年10月,作者Ben Griffis目前是丹麦甲级联赛Kolding IF的数据科学与比赛分析师。
相比于其他数据库网站,best11scouting的特色主要是以下两点:
1. 世界范围内3000+男女足联赛数据(比如英伦三岛13个级别的联赛,意大利12个级别的联赛,也包括中超、中甲、中乙等)
2. 免费数据库网站中不常见的部分Wyscout数据指标:
Smart pass(破线传球)、Second assist(间接助攻)、Third assist(第三助攻)、Acceleration with ball(带球加速,以一定速度带球不少于10m)、pAdj Tkl+Int(控球率调整后的抢断与拦截总和,pAdj的算法以场均60分钟有效比赛时间和50/50的控球率作为基准,防守数据按照球队实际未控球时间调整权重)、Defensive duel(防守中球权争夺成功率,在Wyscout的定义里,Duel分为Offensive duel、Defensive duel、Loose ball duel、Aerial duel,分别是进攻中球权争夺:持球方带球通过对面防守球员且保持控球权、防守中球权争夺:防守方从面对的进攻球员脚下夺走控球权、1/2球争夺、空中球权争夺。中文里上身体的“对抗”是duel时常见的一种方式,但duel的实际含义不止于此。)、pAdj Sliding tackles(控球率调整后的铲抢数)、pAdj Interceptions(控球率调整后的拦截数)
关于Wyscout所有数据指标的具体释义,可见官方链接:
https://dataglossary.wyscout.com/
网页整体布局如图,操作相当简便。左侧竖栏用于输入各类参数,右侧横向标签轴则用于切换各项功能。主要功能有以下4项:
1. 角色排名
2. 生成雷达图
3. 数据筛选及导出
4. 生成散点图
下面依次做个简单介绍,
角色排名
这是一项点题“best11scouting”的功能。系统会根据使用者输入的联赛、赛季、最低上场时长(不建议小于720分钟)、基础阵型,球员年龄(部分低级别联赛年龄数据为0)、合同是否临期、国籍以及每个位置的战术角色等参数,生成最佳11人阵容排名。
可选择的战术角色如下:
门将
Shot-Stopping Distributor
擅长扑救射门阻止进球,也能从容控球在脚参与后场组织的现代型门将。
中后卫
Ball Playing CB
为传控体系打造的中卫,控球、长传能力出色,擅长作为阵型的进攻发起点调度分球。
Defensive CB
专注防守的中卫,核心能力是赢下球权争夺。个中翘楚们精通如何在危险区域避免犯规,从而确保球队防守成果。
Wide CB
相比传统出球中卫,更频繁得在位置相对靠前的半区活动。在球权转换阶段他们的出镜率高于其他类型的中卫,所以他们需要兼顾控球组织和防守,且避免轻易犯规。
边后卫
Attacking FB
能够在边路和肋部区域高速插上,将球推进至危险区域并压制对方边后卫。
Inverted FB
能够内收至中路区域对比赛施加影响的边后卫。他们的任务是保持球权流畅运转,且应具备后腰球员的防守硬度。
Defensive FB
专注防守的边后卫。他们的主要目标是封锁本方边路和肋部区域,而非前插参与进攻或传中。
后腰/防守型中前卫
Possession Enabler
主要任务是保持球权流畅运转及回收球权。这类球员传球简洁高效,擅长横向传导组织。对风险性较高的纵向传球和长传通常较为谨慎。
Defensive Mid
中卫身前防守意识出众的中场屏障。他们专注在各类球权争夺中干净利落地抢回球权,常利用身体优势压制对方中前场球员。抢回球权后的处理,比如安全球、纵深传球或是带球推进等对此角色而言并非首要考量。
Number 6
兼具抢回球权与从容控球能力的后腰球员。虽然不是球队的创造力来源,但他们是三中场体系的核心枢纽。这个角色融合了防守型中场和控球枢纽的特性,通常主导球队大部分球权运转。
Deep-Lying Playmaker
球队纵深进攻的发动机。他们更多是在后场的推进组织,将球传到位于进攻三区的队友脚下,较少参与到进攻的最后一传。鉴于靠后的站位,他们也具备一定防守能力,即便无球阶段不是他们施展能力的主要舞台。
前腰/进攻型中前卫
Progressive Midfielder
以向前推进为核心任务的中场球员。他们凭借传球和带球突破对手防线,使球队进入进攻态势。他们是球队的核心球员之一,通常有相当高的触球数。
Box-to-Box Midfielder
与推进型中场类似,B2B中场经常是场上最擅长赢得球权争夺的球员之一。无论是通过带球突破防守球员,还是在进攻三区保护球权,抑或是在防守三区夺回球权,他们在两个禁区之间都能发挥巨大作用。他们通常体能出色,我们可以用出场时间数作为参考指标。
Advanced Playmaker
球队里位置最靠前的进攻组织者。他们擅于发挥创造力为前场队友输送威胁球、能源源不断地创造进攻机会。相比自主进攻,他们更愿意助攻队友。
Classic CAM
活跃在锋线身后的进攻核心,传射俱佳。在输送威胁球的同时,也需具备自主得分手段。
Wide CAM
擅长拉边活动的前腰,喜欢在肋部和半区与边锋/边后卫形成配合。因此他们被赋予了在边路区域发起进攻的职责,此角色需要具备较强的传中、禁区盘带后倒三角传球以及牵制后卫为边锋创造空间的能力。
Second Striker
作为球队主要得分点的前腰球员,通过禁区后插上和禁区内抢点跑动为自己创造射门得分机会。他们具备一些创造力,但射门得分才是主要目标。
边锋
Playmaking Winger
从中后场开始发起进攻的重要成员。他们不仅承担一部分纵向创造性传球的职责,还需要具备将球推进至前场交到位置更靠前的队友脚下的能力。虽说有球阶段的进攻组织才是他们的主要任务。但由于他们相对较为靠后的站位,相比于参与到进攻的最后一传一射,他们在防守中的参与度会更高。
Inverted Winger
偏好带球内切在禁区前沿甚至进入禁区发挥作用的攻击手。在为队友创造机会的同时,他们会更频繁地寻求自主进攻的机会。具备从边路区域直接威胁球门的能力。
Traditional Winger
经典的边路突击手,热衷于在边肋区域加速突破,通过盘带过掉防守球员后送出传中。凭借速度、爆发力、盘带技巧与传中等核心能力,在边路持续制造杀伤。
Inside Forward
几乎像一名固定在边路区域的前锋。他们和内切型边锋一样采用带球内切的策略,但更强调插入禁区完成终结。临门一脚的精准度是需要放在首位考虑的指标。
中锋
Advanced Striker
球队的核心得分点。他们主要在禁区附近活动,同时也具备反越位插上后带球突进的能力。他们的比赛内容以射门得分为核心,但考虑到活动区域和战术职责,他们中顶尖的球员也能主动吸引防守为队友打开空间,在进球的同时附带少量助攻。
Deep-Lying Striker
具备得分能力但常规站位相对更深的前锋。较深的站位为他们带来了持球向前的空间。他们也会通过回撤接应串联前场进攻,吸引对方中后卫前顶,使后排队友得以切入对方后卫线的空档。由于初始站位更深,他们参与球队传导组织和接到传球的频率要高于其他类型的前锋。
Target Man
长传和传中战术的绝对支点,他们能赢下高空球争夺并完成射门终结。部分球员同时也具备其他技术特点,但他们的核心价值始终围绕着在禁区内赢下高空球、抢点和射门得分。
Playmaking Striker
球队进攻体系的核心组织者。起到的作用类似伪9号。这类前锋会深度回撤或占据前腰区域,协助球队进攻推进并为队友创造威胁性较大的进攻机会。通常,此类角色能与内切边锋形绝妙互补。当他们在核心区域创造出空间后,边锋能在第一时间切入该区域接应传球。这是一个更偏向进攻组织的角色,专注为队友创造机会,因此不考量射门相关指标。
Link-Up Striker
球队控球推进的战术轴心。其核心价值不在于自身持球推进,而是通过接应队友传球充当进攻桥头堡。他们接球后会快速一脚做球给队友,随即反身插入禁区成为得分威胁点。
让我们用本赛季塔子哥的阵型和战术布置举个例子:
同样的阵型换到本赛季西甲再看看:
最后特别说明(作者Ben自己也说了),当前这项功能仍处于概念验证原型阶段。所有角色评估模型均采用五项核心数据加权机制,相当简陋。生成的位置排名既无法全面衡量球员综合能力,也难以精准反映特定战术价值,仅作为探索球员定位的初步参考。
(横轴第二个标签Role Ranking Table展示特定角色的完整排名,这里就不展开介绍了)
然后我们来看第二项功能,
雷达图
雷达图的使用方式也很简单,选择呈现模板(预设或自定义),设定图表参数(柱状图上色方案,p90数据/数据百分位排名,是否显示数据项名称等),按“R”键或点击Submit即可生成。
其中,球员名称和年龄务必与后一个标签Player List中的名称和年龄一致,否则将无法生成图像,以Saka为例:
自定义模板可从以下数据指标中任意选择:
P90传球、P90传中、P90破线传球、P90形成射门的传球、P90预期助攻、P90助攻、P90间接助攻、P90第三助攻、P90推进传球、P90射门、P90非点球预期进球、P90非点球进球、P90推进带球、P90接到传球、P90加速带球、P90禁区触球、P90被犯规、P90高空球争夺、P90高空球争夺成功、P90拦截抢断总和pAdj、P90成功防守动作、P90封堵射门、P90犯规
短传占比、横向传球占比、预期助攻/射门助攻占比、非点球预期进球/射门占比、进球/中目标射门占比
传球准确率、中短传准确率、长传准确率、传中准确率、盘带成功率、球权争夺成功率、高空球争夺成功率、防守中球权争夺成功率
助攻间接助攻第三助攻总和、铲球数PAdj、拦截数PAdj
P90被射门、P90丢球、扑救率、P90阻止丢球、阻止丢球率、零封占比、P90主动拦截高球次数、平均长传距离
需要注意的是,当前雷达图取样的样本数据仅限于同联赛同位置球员,且球员的位置归属在赛季中保持固定(即使实际位置在赛季中发生变化),每个球员仅会出现在一种位置的样本集中。因此样本量偏小,跨联赛球员对比时存在局限性。
这里我选择了我们部分外场主力球员、下赛季的新援以及转会传言对象,根据所属位置调整了雷达图的呈现模板,生成了一些图像用作效果展示。各位有兴趣的话可以一起来看看数据~
中后卫
加布里埃尔(灰色是23/24赛季,彩色是24/25赛季,其中蓝色代表同位置前10%的数据水平,绿色是前35%-11%),黄色前36%-66%,红色是后35%,下同)
萨利巴
格伊
莫斯克拉
后腰
赖斯(23/24赛季,24/25赛季改了位置)
托马斯(24/25赛季,23/24赛季出场时间不足)
苏维门迪
诺尔高
中前卫
赖斯(24/25赛季)
厄德高
边锋
萨卡
马丁内利
特罗萨德
埃泽(24/25赛季)
戈登
姆贝乌莫
马杜埃克
罗德里戈(24/25赛季)
尼科
中锋
哈弗茨(24/25赛季,23/24赛季是中前卫)
伊萨克
沃特金斯
谢什科
约克雷斯
个人觉得数据解读和客观看待任何事物一样,本质上都是一个认知螺旋上升的过程。始于现象层面的认知,经过多维度的复杂剖析后,最终再归于对本质的简单概括。是一个从简单到复杂再归于简单的过程。
将赛场上瞬间的动态压缩为量化指标,本身就是一项庞大的系统工程。作为普通球迷的我们,在这项工程中能获取到的信息极其有限。由于缺乏完整的数据链,单个数据可能具备一定迷惑和误导性;加之手边又没有各类可视化建模工具,我们的解读就好比拿着几块碎片拼图试着去还原全貌。所以有时候不用太在意绝对数值,指标的变化趋势和不同指标之间的内在联系反而是更有趣,更值得探索解谜的地方。
比如上面伊萨克的雷达图里,盘带成功率这项从上赛季的前30%掉到了这赛季的倒数3%,你能说是伊萨克盘带能力不行或者大幅退化了吗?还是说这是一种均值回归?再比如加布的雷达图,破线传球数这项从上赛季的倒数10%暴涨到这赛季的前8%,不是传球能力和视野大幅进步又是其他什么原因?如果是单纯战术职责发生了变化,那么他本身的传球能力又该怎么评价呢?
数据筛选和导出
这是最简单也是最重要的一项功能。在player search, Results标签下点击右上角,一键导出csv即可。导出后放到Excel或者Tableau里进行编辑都很方便。数据筛选在Player Search, Filters标签里。
散点图
界面很直观,也没有太多需要介绍的。首先,选择想要的位置分组(这里的位置分组不局限在单个位置)。然后选择X轴变量、Y轴变量和颜色变量。按“R”键或点击Submit即可生成。
需要注意,这里的提供的数据指标相比雷达图又增加了一些,各位可以自行探索。
举个例子,比方说我要观察24/25赛季联赛中最擅长传出破线传球的中场球员:
(分组选择全部中场球员,横轴P90破线传球数,纵轴破线传球成功率,颜色越接近绿色代表破线传球在总传球数中的占比越高)
至此介绍完成,感谢看到这里的朋友~
Ben还设计一个分析比赛的网页工具,有机会的话下一篇再做介绍。
赤X的骨头
· 四川还没时间细看,先把工具网站收藏了,然后再推荐点赞这篇文章,等空了再看,我每次看数据图第一时间就是看水印找数据网站,谢谢分享!
有联盟在造星看着有意思吗
· 广东不知道说什么给个赞lz吧