为什么这几年那么多人笃信”高阶数据“,说说高阶数据的问题。
最流行的高阶数据有这么两个,第一个是效率值,公式比较简单。
“GmSc 效率值:得分+0.4×投篮命中数-0.7×投篮出手数-0.4×(罚球出手数-罚球命中数)+0.7×前场篮板数+0.3×后场篮板数+抢断数+0.7×助攻数+0.7×盖帽数-0.4×犯规数-失误数”
这个公式的问题很大,就得分那项来说,如果一个人出手5次,进了3个两分,他的效率值得分是6+3*0.4-5*0.7=3.7.如果进了2个3分,他的效率值得分就是6+2*0.4-5*0.7=3.3。然而他们的得分是一样的。
还有后面,助攻和盖帽的加分值是一样的,现实中我们都知道盖帽比助攻难的多。前场板系数是0.7,后板系数0.3,然而你随便打开一个球队的技术统计,队内的后板数据比前板数据要高3倍以上,这个比值显然也不合理。后板和助攻的比值高的过分,然后犯规和丢罚球扣分一样多,实际上很多战术犯规负面效应并不严重,这也是拍脑门的数据。
还有就是PER值,查了下公式,看起来很复杂。要分三步算。
第一步uPER = (1/MP) ×{3P+ (2/3)×AST+ (2 - factor×tmAST/tmFG)×FG+ FT×0.5×[1 + (1 - tmAST/tmFG)]+ (2/3) × tmAST/tmFG-VOP*TO- VOP×DRBP×(FGA - FG)- VOP×0.44×[0.44 + (0.56×DRBP)] ×(FTA - FT)+ VOP×(1 - DRBP) ×(TRB - ORB)+ VOP×DRBP×ORB + VOP×STL + VOP×DRBP×BLK - (PF×lgFT/lgPF) - 0.44×lgFTA/lgPF ×VOP }
第二步aPER = (pace adjustment)*uPER
第三步PER = aPER*(15/aPERlg)。
看起来是个很唬人的东西。
从个人PER开始讨论,我们从第一项开始,先看正面数据,第一项三分;第二项助攻;
第三项命中(2-影响因子*球队助攻/球队命中数)*命中数,大概的概念就是你的球队越倾向单打,你的命中数越值钱,你的球队越能传切助攻,你的命中数越不值钱。(我不知道为什么这样做)
第四项罚球 罚球多加分,但是球队配合好,罚球命中的价值也要下降。
第五项是球队配合效率-球员失误的,VOP是联盟平均进攻效率,TO是失误
第六项是投丢的扣分,DRBP是联盟平均后板/联盟平均总板。
第七项是罚球罚丢要扣分
第八项是拿后板的加分
第九项是拿前板的加分
第十项是抢断加分
第十一项是盖帽加分
第十二项是犯规扣分
说一下有利于什么样的球员吧,进攻方面,助失比在1.5以上的持球核心,魔球打法球员(三分命中率降低但是有额外加分,中投命中率肯定不如篮下,但是投丢扣分一样多),能博得罚球的有哨球员。
比较大的问题是,球队进攻效率几乎完全不考虑,比如邓肯,诺维茨基这样经常在高位做无球掩护,或者像库里这样通过跑动为队友拉开的空间,是完全无法体现的。他们通过无球掩护,让队友获得4打3的机会,然后空切篮下得分,从PER值来看,因为前者会提高球队受助攻比例,将会减分。还不如站着等队友怒打一铁。
防守方面更鼓励蹲守在禁区护框和协防的球员,防出去的球员非常吃亏,因为防出去增加了犯规的可能性,而犯规在个人PER值中,扣分很高,在禁区护框更容易获得盖帽的机会,而且降低了因为犯规而被扣分的风险。对手的命中提高,对PER值是没有影响的。
算完了个人的uPER,然后aPER里面pace adjustment=lgPace / tmPace。Pace是回合数。
联盟的回合数是分子,队伍回合数是分母,所以节奏慢的队伍在里面更占优势,联盟最高和最低的球队能差接近10%。
所以PER值体系下加分的球员是这么打球的。
1出手方面:多得分(废话),并且出手点尽量接近篮下,能投三分,能造犯规。
2防守方面:靠近篮下护框,尽量不要防出去避免犯规,哪怕放投也不要犯规,获得后板的几率也会变大。
3进攻选择方面:最好能直接形成助攻再传球,不然就自己单打,然后减少可能造成犯规的掩护。
4球队方面:尽量选择能压节奏的队伍,让队伍整体回合数变少。二当家最好是一个强力的单打手,一方面可以帮助你压节奏,一方面可以降低队伍的受助攻率。
擅长无球掩护,低效中投,贴身防守干扰对手的球员很容易被扣分。
进攻端当持球大核,得分以篮下为主,三分为辅。防守端蹲禁区护框,后板多,犯规少。打球的时候压节奏,你可以传球给队友得分,因为助攻加分很多。但是不要大范围无球掩护让队友组织起来,因为球队总助攻数会降低PER值。
这样的球员PER值会非常好看。比他们的实际贡献要高。
没错!我说的就是你!尼古拉.约基奇!dog/
SmallMushrooms
· 广西因为前几年有人高阶数据好看
夏天喝绿茶最好了
· 浙江这种帖子就应该多发。作为一个高阶数据的信奉者,我认为追根溯源是很重要的,只有理解高阶数据的计算方法,才能明白高阶的局限性,才不至于唯高阶论。不过我还是认为,相比基础数据,高阶是更准的那一把尺子。比如你提到PER这个数据不考虑球队节奏,事实上基础数据里的得分篮板助攻同样不考虑球队节奏,PER好歹考虑到球队节奏和联盟平均节奏的区别加以修正。