简单聊一下高阶数据-DWS
很多水友喜欢发各种高阶数据的截图,但是和某些水友交流一下后发现,他自己也不知道自己发的是什么东西,就好比三国志武将多维图,他只知道框大的很厉害,至于拿内政个位数的种田,不是他关心的。
所以简单和大家聊聊。
先说说DWS这个数据,竟然有人拿这个数据说哈登库里的防守被低估,保罗和乔丹没想象中那么强(挂人就不挂了)。他的唯一论据就是DWS。
聊高阶,翻译名其实不关键,防守效率值也好,防御力也罢,只要不是黑箱公式,最重要的当然就是数据的来源——公式。
数据来源NBA Win Shares | Basketball-Reference.com
DWS=(marginal defense) / (marginal points per win)
其中,
marginal defense=(player minutes played / team minutes played) (team defensive possessions) (1.08 * (league points per possession) - ((Defensive Rating) / 100))
Marginal points per win reduces to 0.32 (league points per game) ((team pace) / (league pace))
看似很杂,其实还是比较容易理解的,注意这个系数 Defensive Rating,是指球队百合被对手攻下的分数。是一个70年代开始使用的数据。是一个球队数据。
(player minutes played / team minutes played)和个人出场时间相关
marginal points per win则主要和联盟节奏及球队节奏相关,同样和球队高度相关。
所以DWS你以为是个人数据,其实是一个团队数据。也就是所在球队防守好,那么出场时间多的球员都会获得很高的DWS,而分配逻辑也很简单,就是你的出场时间。
所以勇士队和火箭队当年作为联盟最强的球队,DWS高分的库里和哈登也是很正常的。
同理,你很容易DWS前30到50看到某个队的全部首发。
其实DWS还只是个小玩意儿,真正玩出花来的是BPM,以及它的一系列诸如vorp等等的衍生数据。仿佛华尔街的金融产品,无穷尽也。这个有空在本贴编辑聊吧。
关于BPM的一小部分:
既然聊了BPM,也就简单聊一下吧。
bpm1.0的公式是这样的
Raw BPM = a*ReMPG + b*ORB% + c*DRB% + d*STL% + e*BLK%+ f*AST% - g*USG%*TO% + h*USG%*(1-TO%)*[2*(TS% - TmTS%) + i*AST% + j*(3PAr -Lg3PAr) - k] + l*sqrt(AST%*TRB%)
简而言之,就是一堆基础数据加权运算。这里要提一点,BPM和WS不一样,不是累计数据,而是一个百回合数据。
这个公式对怎样的球员评价更高呢?
1高出场时间
2和队友的命中率差值,也就是你的命中率越高,同时队友的命中率越低,你得到的评价就越高。
3高球权,也就是高终结率(个人更喜欢用这个词,不过普遍用“使用率”这个说法)、助攻、和篮板
所以,这个数据被威少打爆了。
为了让一切不那么尴尬,公式作者Daniel Myers修改了公式,其中最重要的就是修订了不同位置针对不同数据的系数。
这里也说一下,个人认为比较有“特点”的修改
1号位拿到防守篮板的价值很低,5号位很高。(这里的位置是球员位置,如果你是控球者,但不是控球后卫,你拿到防守篮板不会按照1号位计算)
2发明了Creator和Receiver这两种进攻角色的说法,在绝大多数情况下1号位是Creator,5号位是Receiver,出手和罚球是扣分项,同样的次数,Creator扣分少,Receiver扣分多。
部分原文如下:
The coefficients vary linearly between position 1 and position 5. If a player is position 1, the coefficients for position 1 in the table above are used. If a player is position 3 (i.e. small forward), then coefficients halfway between the first column and the second column are used, since position 3 is halfway between position 1 and position 5.
总结一下,如何获得更好的bpm
出场身份是3 4 5号位,但是进攻的时候把球捏在手里。同时获得高系数加分和Creator的低系数减分。
拥有高使用率和高出场时间。
保持命中率多投简单球,让队友投难球。
不作为1号位,拿到更多的easy篮板。
更多的助攻。
所在的球队赢球要多。
我最佩服的就是15 16上赛季的库里,作为1号位能拿到当季最高OBPM,而且远超第二。个人认为是最近20年最好的常规赛演出。
另外说一嘴,论坛里都很喜欢用的表格里的vorp,一般和BPM都单独作为一列。
公式为:(BPM-2)×MP/Team MIN
可见,这个数据几乎等于BPM,两个相似出场时间球员,如果他们的BPM差不多,那么他们的vorp也基本相同。
不过有个问题,哪怕忽略bpm那弄弄的定制味,这两个数据都单独作为一列会不会不太合理?或者是excel会有些放大效果?
这就好比别人班级排名次,拉出来的表格是语、数、外成绩,你们班级是化学成绩,化学选择题成绩,化学成绩*做题时间。
20年后小皇帝
· 陕西如果能分析到这些个高阶数据,能每天起来研究这个玩意儿,我觉得应该是纯粹就是为了去找点某些方面能黑某些人的论证去了,肯定不算什么高级球迷。普通球迷就是看球,欣赏比赛内容,支持自己喜欢的球星,可能就仅此而已。