CBA球迷难道不配有像样的数据服务么?

avatar
关注

三年前我注册了一个微博账号,开始搬运,科普,展示各种各样的NBA数据,这个过程中一直都有不少CBA的相关从业人员来关注我,私信我,有时候是一些对现状不满的牢骚,有时候是遇到现实的数据问题来找我讨论。时不时也会有普通球迷感叹:我们自己的联赛什么时候才能有NBA这样翔实全面的数据服务?

三年来我能确实地感受到这股需求。但直到去年,我才真正理解到需求是怎么样,而现状又是怎么样的,这两者之间到底有多大的鸿沟。我去年认识了一个朋友,他作为一个留学完成了体育管理硕士课程的专业人士,选择越过千阻万险去实现自己的体育理想,甘愿拿一份绝对对不起他学历和才干的工资,到一支CBA球队的一线去工作。他入职的时候问球队的领导,我们有什么比赛数据?得到的回答是——这不正等着你来做么?我不敢说这是整个CBA的现状,但据我了解,大部分球队的情况都是相似的,只有个别几支职业化程度较高,发展较好,资金比较充裕的球队能稍微走的靠前一点。

职业球队的比赛数据并没有太多专门的供应渠道,前几年姚明上任后CBA确实和贝泰科技达成了合作,表面上看起来向前迈进了一大步。贝泰科技手中的数据全部都是来自Sportradar的,这家公司也是NBA的官方数据供应商,也给我们熟悉的篮球数据网站BBR,CTG等提供数据,但是他们并不提供最新的追踪数据。贝泰手中最有价值的数据是比赛的play-by-play记录,有这项数据意味着CBA的数据服务在数据源层面达到了NBA1996年的水平。

但我为什么要强调“表面上”和“数据源层面”呢?首先,正如前面所说,很多CBA球队是没有购买贝泰的数据源的,因为他们的价格并不便宜。据我了解,贝泰的数据服务报价在10w到20w一年不等,很多CBA球队负担不起,更准确的说是不愿意负担这笔钱。

从贝泰的角度讲,他们觉得球队不识货,一群体校出来的“大老粗”不懂数据的价值。但从球队的角度看,贝泰提供的数据完成度并不高,买了之后不能直接用,还需要雇佣专人负责数据的清理和分析,再撰写教练组和球员能迅速理解的报告。大家应该知道市面上其他行业能干这种工作的人的薪资大致是什么行情。

从整个体育数据行业来看,贝泰这样也并没有太大不妥,Sportradar提供给他们的客户的服务也是类似的。NBA球队分析师也曾抱怨数据供应商提供的数据需要花大量时间来清理。另一方面,从贝泰公开的内容和他们给球队的Sample来看,他们也缺乏真正了解篮球数据的人才来做真正的分析。

数据价格高,完成度却不足,是球队望而却步的主要原因。贝泰的主要客户实际上是门户媒体,很多球队内部人员要总结球队数据同样是从门户网站上找,和每一个CBA球迷一样。那么门户网站的数据呈现对得起他们花的钱,回应的了球迷的需求么?显然也是不能的。比如说网易的CBA数据页面点进去,我点到易建联的个人数据页面

易建联???上海????先不说出手数,罚球数,盖帽,犯规,失误全都没有,即便呈现出来的数据,连小数点位数都统一不了也太敷衍了是吧?

已经差不多被遗忘的门户网站搜狐在基本呈现上要相对好很多,至少最基本的数据项目都能正常展示,也不会给易建联安上董瀚麟的脑袋。但有时候还是会出现一些哭笑不得的事情,比如这赛季,山西的强力外援富兰克林前四场比赛的数据都没有出现在山西队比赛的数据页面里,山西的球队得分和球员得分加起来总是差了那么三十多分,类似的情况还发生在江苏,新疆和天津队身上(不过我给搜狐体育的小编反映了后修复的倒是挺快的)。

财大气粗的腾讯,唯一的数据页面是得分篮板助攻抢断盖帽五项数据的场均前五排名,其他内容一概没有,只有在直播页面下面有单场的数据统计。

大家比较信赖的虎扑的网页端的数据页面,随便点一场比赛进去你都有可能看到这种画面。

上面的总比分和下面的比分合计是对不上的,两队的先发都只有4个人,这样的数据统计你根本不知道哪个数据是可以信赖的。

新浪CBA和虎扑的App端可能是中文网络上勉强满足最低需求的。但如果深究同样有很多问题,比如最基本的数据标准化是完全没有的,只有总计和场均两种数据。球员数据你基本上不知道怎么样算高,怎么样算低,虎扑的呈现方式是告诉你全联盟排名,但如果不区分位置,这样的排名根本没有意义,难道要后卫和中锋去比盖帽和篮板么?新浪有同位置球员比较,但只和同位置的场均平均数比较,大量上场时间不足的球员一算,任何数据的均值都很低,完全没有比较的效果。更别说,虎扑还把个人ORTG,DRTG这样的严重误导性数据放在显眼的位置作为“高阶”数据卖弄。

我不禁要问,是不是这些媒体都觉得我们的球迷配不上一个像样的数据服务?某种角度讲可能确实如此。因为看CBA的人本来就少,而看CBA的人经历了这些年乱七八糟的数据呈现,更是不乐意去看这些数据了。没有流量反馈对互联网公司来说就不值得花任何时间去做。那些错漏问题即便知道也没有太大修复的动力,更别提什么越做越好了。

我最近特别去问了殳海老师,他作为赛前准备上比较用心的专业解说,怎么面对这种局面,他也说这是他们非常苦恼的事情,CBA的官网年年都改版,改来改去也不好,最后他只能查RealGM,到国外网站上去找我们的联赛数据。

去年,我想给我那位在CBA工作的朋友帮点忙,自己从各大门户搜集,查漏补缺,终于能够把CBA的最基本数据收集起来,再根据NBA的通行做法,至少能给出一个类似BBR的基本数据内容,这基本上也是贝泰提供的最主要内容了。这份数据他的反馈不错,据说他们队的总经理看了一次之后,过了一阵子还特意问他要更新的最新版看。今年夏天他去参加CBA官方组织的分析师培训课,课上的讲师看了这份数据也直接拿去作为讲课材料使用了。

世界杯的时候,作为一个篮球博主,我和大家一样感叹过我们国家的篮球发展水平落后世界太多。我可能无法像我朋友那样工作在推动中国篮球发展的第一线,但我也有我能做的微小贡献。今年,我打算继续做这份CBA数据,虽然我那位朋友现在转到青年队工作,暂时用不上这些数据了,但我打算把这些数据重新做全面的整合,参照开拓者和76人的前副总Ben Falk的思路来呈现这些数据,用Ben Falk的话说,叫做“See the game the way the pros do." 我们按照NBA职业分析师的思路和手法来做,提供真正能够用来分析的数据。当然,碍于数据源的限制,我没法做到完全复刻Ben的手法,毕竟我个人负担不了贝泰的数据源费用。具体来说,我会在下面的链接不定期更新本赛季的CBA各项数据(至少每周一会更新一次,其他更新时间不定)


感兴趣的人可以把链接复制到PC端浏览器使用,由于数据较多,手机端的使用体验会很差。

这里面目前有三个大的板块,分别是球员的综合数据页面,常规数据和进阶数据。

综合数据页面是根据Ben Falk的网站CleaningtheGlass上的做法将各类数据中最反映球员比赛水平的数据进行模块化整理,小范甘迪曾在季后赛全美直播的解说中称它为“真正聪明的篮球分析网站”。所有数据都会根据同位置水平提供百分位数(即下面图中的色阶部分,代表该项能力超出同位置X%的球员)。

常规数据部分就是大家平时最熟悉的基础数据,但在总数和场均以外,我还会提供进行过标准化处理的每36分钟数据和每百回合数据,以及大量便于大家查找特定类型数据的筛选工具和各种特定条件下的排名。

进阶数据部分就是所谓的高阶数据,除了同样提供各类筛选器以外还会附加一项我针对CBA设计的正负值类综合型数据REC,它是根据RPM的核心算法RAPM在只有基础数据的情况下所作的估算,经过一些修正能一定程度上反映球员在场时每百回合为球队带来的净胜分影响,以及基于REC计算的胜场贡献WINS。详细的内容可以看这篇文章中的解释如果我们为CBA建立一套正负值模型会怎么样?。我并不能说这是一个完美数据,但它会比现存的其他CBA综合型效率数据都要更好。

我知道这个东西不会有太多的流量,不会成为一个“爆款”。这三年来我们其实一直都在发很多并不会带来流量,但我们认为真正有价值的内容。我们的CBA球迷当然配得上一个像样的数据服务,而我努力的目标是让我做的东西配的上我们的球迷。

目前的版本还并不完善,我会继续更新和修改,也会撰写说明文档,方便大家理解。而且目前还只有球员版本,接下来我还会制作球队版本,这也会是目前所有中文网站上没有的内容。

我希望这份数据不仅能帮助CBA球迷更好的观赛,也能给我们的解说员,我们的CBA球队分析师提供帮助,而且是完全免费公开的。如果你是资深CBA球迷,CBA球队分析师,或是CBA解说,你有任何使用上的感想或者具体的需求,请及时告诉我,只要技术上能实现,我会尽量从美国业界通行的专业角度满足这这些需求。

虎扑的CBA区的朋友可能是国内关注CBA热情最高的一群人了,我不清楚大家平时如果要看数据有什么可靠的途径,我希望我做的东西对大家来说能有用。如果用了之后有什么意见和需求可以告诉,在微博“篮圈即是原点”私信我,或者在公众号“篮圈上的坐标系”后台给我留言都可以。后续有新的更新也会第一时间在这两处发布。

发布于京都阅读 61428

这些回复亮了

discusser-avatar

凤凰惊雷

· 广东
三分比扣篮准佩服楼主这样的球迷,cba发展20多年,至今没有可靠的数据库可供球迷查阅。收起

连靠谱的早年球员名单都没有,我之前自娱自乐写广东宏远史略时都是直接去东莞图书馆一张张翻东莞日报了解球员情况的。

亮了(96)
查看回复(3)
回复
discusser-avatar

RC-1136楼主

· 京都
好老球迷你不是普通球迷了,达到了利用数据挣钱的级别了。咱也不太懂你们的江湖,但这标题有代表我们所有人之嫌。收起

我做的这个不收费,不挣钱,完全免费公开,纯粹服务有需求的人。我本人也做这些也全都是下了班之后业余时间做,不靠这些吃饭。 这标题我也不知道我代表了谁,我只是陈述一个客观事实,那就是现在cba球迷没有得到像样的数据服务。你能说说我代表了谁,怎么代表了?说了什么不该说的?

亮了(93)
查看回复(5)
回复