开头声明:为读懂本文,读者应具备基本的数学、逻辑能力。
“掐头去尾”是篮球论坛上对统计球员数据时去掉新秀赛季和养老赛季的截取数据做法的戏称。这种算法有其合理性,掐头去尾更能反映球员巅峰的实力。但也有不合理的地方:
(资料图片仅供参考)
标准不统一,邓肯、库里、詹姆斯这些球员该怎么截? 讨论累积数据、最年轻记录的时候,要不要截? 讨论巅峰水平,最合理的是挑选巅峰赛季,而不是掐头去尾。但绝大多数人没有意识到: 掐头去尾对球员数据并不总是有利的 。本文以球星K的真实案例,告诉你为什么掐头去尾这种看似照顾的操作,竟会暴露出球员的其他问题。
球星K“掐头去尾”的标准比较容易界定,一般是前2个赛季(替补),后3个赛季(大伤)。
(一)场均数据
K的生涯场均数据对强迫症很不友好。生涯场均24.99分不到25,命中率44.73%不到45%,三分命中率32.94%不到1/3(对应50%的EFG),助攻4.68次不到5,抢断1.44次不到1.5,盖帽0.48次不到0.5。
“掐头去尾”后,K的生涯数据全面提升,而且对强迫症友好多了。 从98-99到12-13赛季,K是一个场均27+5+5的球员 。这是一份相当体面的基础数据成绩单。
看起来,“掐头去尾”没什么不好的。然而:
(二)季后赛数据
一名球员能否在季后赛中提升他的表现,是评价球员能力的一个重要维度。
有人认为,K季后赛相比常规赛,数据上升了。
乍看确实如此,得分、命中率、助攻都上升,失误、篮板下降。得分上升很正常,但命中率上升是连乔丹、詹姆斯都做不到的。
然而,如果用“掐头去尾”的数据比呢?结果是,一旦掐头去尾,季后赛中,K的得分、命中率、篮板、助攻全都下滑。
不“掐头去尾”,季后赛数据全面上升;“掐头去尾”后,季后赛数据变成全面下滑。
为什么会出现这种怪事?因为 一名球员生涯末年如果数据糟糕、球队又进不了季后赛,那么将导致常规赛数据变差、季后赛数据则不变,造成季后赛强于常规赛的假象 。掐头去尾戳破了这个问题。
像邓肯这样年年进季后赛的球员,显然无法通过生涯末年变相抬高自己的季后赛水平。
(三)缺席胜率
有人指出,从2000-2002年,K缺席场次,球队取得25胜7负战绩,胜率78%;而这三年,球队的总胜率是73.6%。也就是说,K缺席时球队胜率反而变高了。
当然,有人指出,K生涯球队胜率是59.2%,出席时胜率为62.1%,缺席时胜率为43.5%,虽然不如库里、詹姆斯等球员明显,但也还行,小样本不能说明问题。
两种证据的差别怎么这么大?
我们掐头去尾,结果是从98-99到12-13赛季,球队胜率是64.4%,K出席时胜率为64.7%,K缺席时胜率为60.2%。这么一看就比较尴尬了,似乎K缺席对球队取胜的影响较小。
如果不直接掐头去尾,改为把每个赛季的胜率直接做算数平均(等权),也能得到类似结果。
不“掐头去尾”,缺席时球队胜率较低,“掐头去尾”后,缺席时球队胜率明显变高。
为什么会出现这种怪事?本质上, 如果一个球员生涯末年出勤差,同时球队的实力也差,那么就会拉低缺席胜率,造成缺席胜率挺低的假象 。掐头去尾戳破了这个问题。
举一个最极端的例子,假如一名球员最后三年一场没打,球队每年0胜82负,那么这名球员的最后三年毫不影响他的出席胜率,却给他凭空增加了246场缺席负场。
我的观点: 掐头去尾的做法对球员数据分析并不总是有利的。低谷也是球员生涯的重要部分,掐头去尾大可不必。
附录A:
至少杀入分区决赛的赛季,乔丹、科比、詹姆斯、库里、杜兰特的季后赛数据,相比当季的常规赛有何变化。
以算术平均计(不够严谨):
基础命中率下滑最小的是科比,真实命中率下滑最小的是詹姆斯。 只有乔丹和詹姆斯提升了得分。 只有乔丹提升了助攻。 只有詹姆斯和库里提升了篮板。 只有詹姆斯提升了抢断。 乔丹、科比、詹姆斯提升了BPM。附录B:
邓肯、詹姆斯、杜兰特、库里的缺席胜率情况。
(完)
关键词: