两项高阶数据告诉你:C罗并非“浪射王”
2020-02-05 21:09:18 来源:CCTV5在线直播
长篇引言:什么是“射门选择提升值”?什么是“射门精度提升值”?为什么要引入这两个算法?
为什么要用数据?为什么要用高阶数据?因为数据应用的精髓在于“抽丝剥茧”,一层一层推翻我们过去固有的错误认知。当然,如我之前所一直强调的:数据和录像本身并不冲突。事实上,多数情况下,数据进阶程度越高,和你反复观看录像的感觉,就越接近。但有没有想过另一种情况?
你看录像得出的结论,是建立在一个“错误参照系”的基础上?
比如说C罗“浪射”的依据,是他的射门数,比其他人更多?
有没有想过这样一个问题:这些射门,到底是“压根就不该射”,还是“可以射”?
要知道,每支球队创造机会的能力是不同的;每个球员把握机会的能力也是不同的。当我们考量一名球员射门选择与能力时,其实需要考虑的因素非常多,而绝不仅仅是射门数字的简单对比。这里用一个我之前在讨论禁区内触球时用过的图说明一下问题,这是本赛季英超,诺维奇队的前锋普基的一脚射门:
真空环境下,普基这脚射门其实根本就不该存在——射门角度本已很小的情况下再遭遇对手封堵和贴防,即便打上力量,门将只要不出现低级错误,也很容易将之封堵出去。但问题是,普基全程都处于孤立无援的状态下,你让他“不要急,先控球,别丢球”,那恐怕才是扯淡的要求。
当然,类似情况在C罗身上很少见,毕竟C罗长期处于顶级强队,不大可能出现普基这种不得不单兵作战的窘境。但另一个事实是:C罗自身也经常出现在比队友更适合射门的位置,那么,为什么C罗不能借此轰出更多的射门?
诚然,他会在某些时候极不理智的打出一些殊无把握的远射;但有没有想过三个问题?
第一,这些不靠谱远射,相对于其自身大量射门而言,是不是只占了很小一部分?也就是说,从总体上看,C罗的射门选择并不差?
第二,这些不靠谱的远射,可能是在球队所有人也没有更好办法的情况下,被迫做出的进攻尝试?换言之,不这么打,其实也没有一定更好的策略?
第三,结合所有射门来看,你让C罗打,比让队内其他人打,要好一些。或者说,只看队内的情况,C罗的选择其实还算是相对比较好的?
讲白了,我们要解决的不是“你自己的表现如何”,而是“你的表现,相对于你所处的环境而言,怎么样”。
为此,我在今天特意创造了两个新的算法:“射门选择提升值”和“射门精度提升值”。
之前已经给大家介绍过“预期进球数”这个很多数据网站都在做的高阶数据了,并且也给大家普及过我自创的“真实射门得分率”概念。但这两个算法都是直接针对球员个人的,没有结合球队环境。这就产生了一个疑问:
一个球员所做出的射门选择,和他的射门把握程度,比队内除了他之外的其他人,强多少?
为什么要做这个考量呢?举一个例子:
这其实是C罗在难度极大的情况下,硬是靠身体素质打进的一球。这球的预期进球数只有0.11。要知道,预期进球系统是对射门瞬间射门难度的量化,既不考虑射门质量,又不考虑射门是怎么形成的。如果综合考虑这次战术,其实尤文在理论上的选择是很不合理的——门前只有2人抢点,对手4人防守,长距离传中找后点,对手也不大可能漏人;而为了传中能够中间不被拦截,又不得不把球打的很高,这种传球,你换个弹跳差一点的人来,大概率是根本碰不到球。
那么,你说C罗做出这样一次预期进球只有0.11的射门选择,是环境使然,还是自己“浪”?
为了解决这个问题,我特意以C罗的生涯轨迹为线索,抽取了15-18年三个赛季的西甲,以及18-20年两个赛季的意甲,射门总数前10的球员,然后排除他们每个人的射门总数、进球总数和预期进球数后,再计算其所在球队“每次射门的预期进球数”和“真实射门得分率”。最终得出了这样两个公式:
射门选择提升值=球员个人每次射门预期进球数-队内其他球员每次射门预期进球数
射门精度提升值=球员个人真实射门得分率-队内其他球员真实射门得分率
事实上,如果我们把讨论对象集中到每个赛季联赛射门次数最多的10个球员中,就会发现,其实C罗的选择与把握度,其实还可以。
我们从15-16赛季的西甲看起。
15-16赛季——C罗近5年来最差的一年,有可能跟贝尼特斯的失败经历有关
横轴为“射门精度提升值”,越靠右,表明该球员比队友射门更准;
纵轴为“射门选择提升值”,越靠上,表明该球员比队友射门选择更好;
圆点大小为球员每次射门预期进球数,越大表明该球员自身的射门选择越好;
圆点颜色为球员真实射门得分率,越接近深蓝色表明该球员自身的射门越准。
实话实说,15-16赛季确实是C罗的小年,无论是射门精度,还是射门选择,都出现了不小的问题。不过这里面很可能有贝尼特斯时代全队乱七八糟的因素。那个赛季皇马解雇了深得球员支持的安切洛蒂,稀里糊涂的任用贝尼特斯,结果经历了相当长一段时间的“贝大师乱政”。前期说是全队“乱枪打鸟”都不为过。比较神奇的是本泽马在那个赛季迎来大爆发。其实你去对比一下真实射门得分率,本泽马再15-16赛季的表现还要比本赛季更好。
熟悉我之前文章的朋友应该都知道,我自己是几乎不谈“心态”的,因为尽管我承认它很重要,但对这种搞不到一手资料的东西,还是“存而不论”的态度比较好。因此,C罗这赛季的表现,我也不想简单归咎于心态问题。不过一个事实是:在这个赛季,C罗的表现确实存在一个后续的突然攀升——你说这是不是皇马换帅的结果?不知道。一方面C罗自己本身就有慢热的习惯;但另一方面,皇马后半程在齐达内带领下“拨乱反正”、重回正轨也是事实。这里把C罗那个赛季的真实射门得分率贴出来,后半程确实比开局阶段要好得多:
另外值得注意的是,梅西在图中的位置非常尴尬。但那个赛季梅西自己让权给苏亚雷斯和内马尔,并且自身状态不稳只是原因之一,还有一项不能忽略的因素是我们这两项高阶数据的算法。它们计算的是你和队友之间的差距,是“相对值”而非“绝对值”。也就是说,如果你的队友当中有一个射门选择又好,射门精度又高,而且射门非常多导致其在全对射门总数中占比极大的神人,那么你的表现,几乎就不可能好。梅西就是这个情况——15-16赛季,正值巅峰的苏亚雷斯轰出了8.49%的超高真实射门得分率。
16-17赛季——C罗最近一个金球
横轴为“射门精度提升值”,越靠右,表明该球员比队友射门更准;
纵轴为“射门选择提升值”,越靠上,表明该球员比队友射门选择更好;
圆点大小为球员每次射门预期进球数,越大表明该球员自身的射门选择越好;
圆点颜色为球员真实射门得分率,越接近深蓝色表明该球员自身的射门越准。
这次C罗的位置非常好,看上去只是在散点图正中央而非更偏近右上角,只是因为西甲中下游球队出“大腿级射手”的惯例下,安东内和鲁本·卡斯特罗,人为的把两项数据都给打高了而已——没办法,这俩队也确实只能靠他俩干,没看他们的圆点颜色已经变成黄色么?说白了他俩自己的射门精度其实很不怎么样,但队内其他人更菜,所以……
那个赛季是皇马历年来表现最好的一季。C罗则确实是队内进攻端最值得仰仗的射门者。从图中的位置上看,让他射门也确实比让其他人接管好得多。其实从图中几个人的名字我们也能看出端倪:射门入围西甲前10的球员里,巴萨占了3个,皇马则只有一个C罗。尽管我历来反对“最好球队最好球员拿金球”的说法,但按照这个普遍存在的不成文标准,C罗最近一个金球,还是很没悬念的。
另外那个赛季,苏亚雷斯几乎可以封神——此人打出了11.56%的真实射门得分率,今天中午还有朋友在微博给我说,那两个赛季的苏牙,是怎么射怎么有。图中苏亚雷斯的圆点也是颜色最深的。那为啥苏亚雷斯并没有出现在图片右上角?还是那个原因,梅西和内马尔表现都不差,尤其是梅西,真实射门得分率也达到了相当漂亮的7.05%。
17-18赛季——C罗自己表现不好,可问题是队友表现更糟糕啊
横轴为“射门精度提升值”,越靠右,表明该球员比队友射门更准;
纵轴为“射门选择提升值”,越靠上,表明该球员比队友射门选择更好;
圆点大小为球员每次射门预期进球数,越大表明该球员自身的射门选择越好;
圆点颜色为球员真实射门得分率,越接近深蓝色表明该球员自身的射门越准。
说实话,今天做图的时候,我对着这张图看了好久,因为它太魔幻了。
图中除了拉斯帕尔马斯的卡莱里之外,只有C罗一个人的圆点是黄色,或者说“非蓝色”,这说明,在射门数前10的球员当中,C罗的射门精度,确实是最差的之一。事实上他那个赛季的真实射门得分率是非常尴尬的-0.46%,这意味着他的射门把握,比结合大数据系统用几十万次射门计算出的预估值,是要更低的。
但问题是,C罗在图中的位置却并不算差,其真实射门得分率,甚至比其他队友要高出13.66%,在射门前10的球员里,排名第7。也就是说,C罗自己的表现并不好,可是队友更差……
与此相对应的是图片左下角的梅西——他的圆点颜色是很深的蓝色,圆点也很大,这说明他的真实射门得分率非常高,射门选择也很好,但为啥还是会在这个位置?因为队友更好——注意右上角有一个苏亚雷斯,梅西的两项高阶数据,就是被苏牙给冲淡的。
这里就要提到这篇文章的主旨了——我们讨论“浪射”时,一定要注意球队环境。你现在拐回头看17-18赛季皇马的录像,C罗确实低质量射门很多,可你再仔细想想,他不这么打又能如何?那个赛季相当长一段时间,皇马实际上是陷入了“攻而不克”的困境中。所谓的“欧冠三连冠”,其实是一个偷换概念的错误说法,因为这是三年的成果,不是一年的成果。实际上17-18赛季,皇马是在联赛落后巴萨接近20分的情况下,欧冠一路惊险啃下来了一个冠军。大样本下看,那个赛季的皇马甚至连“虚假繁荣”都算不上。说白了,那个赛季皇马的环境非常糟糕,C罗其实是比队友表现更好的,那个表现不好的人。
这么说,你总不能说他浪射了吧?如果他是浪射,那么拉斯帕尔马斯的那个卡莱里算什么?明明是球队的头号大腿,但猜猜这人当季的真实射门得分率是多少?-4.51%……
18-19赛季——其实整个意甲都不好
横轴为“射门精度提升值”,越靠右,表明该球员比队友射门更准;
纵轴为“射门选择提升值”,越靠上,表明该球员比队友射门选择更好;
圆点大小为球员每次射门预期进球数,越大表明该球员自身的射门选择越好;
圆点颜色为球员真实射门得分率,越接近深蓝色表明该球员自身的射门越准。
18-19赛季,C罗在转会市场和意大利股市掀起巨大波澜,转会尤文图斯。那个赛季的故事大家都知道:C罗开局阶段仿佛被下了降头一般,天天遇到对手门将开挂——但没办法,预期进球数系统是“射门前”的数据,不考虑对手门将的表现,因此C罗的真实射门得分率必然会因此吃亏。最终C罗-1.73%的真实射门得分率也确实不好看。
不过,那个赛季的意甲不知为何,出现了一个相当诡异的现象——各队射门多的进攻大腿,一个比一个萎。图中选取的射门榜前10里,居然只有夸利亚雷拉和萨帕塔的圆点是蓝色,最吓人的是基耶萨和哲科,都快成红色了……
而且,尤文其他球员的射门把握也不怎么样,加上C罗一贯出众的抢点意识,他在图中的位置其实相当接近右上角。说实话,这个现象我也不知道如何评价,可能整个意甲在那个赛季都有点低迷。
不过既然我们讨论的是“是否浪射”的问题,那么C罗处于这个位置,无论如何我们都不能说他“浪射”。在转会意甲的第一个赛季,尽管遇到了很多困难,但显然,他仍旧比队友射门选择更好,射门也更准。
19-20赛季——已经开始呈现出慢热迹象,C罗存在回调趋势
坦白讲,在12月中旬做“真实射门得分率”那篇文章时,我很犹豫要不要写意甲。因为当时C罗的情况确实非常糟糕,如何应对如此庞大的球迷团体,我也完全没有把握。但最后我还是写了,批评之余我也说了:C罗历来有慢热习惯,而且如果能增加抢点的话,把数据打回来其实非常容易。
事实也确实如此,当时为负的真实射门得分率,如今已经成功打到了体面的3.93%。这里放一个折线图大家看看,C罗射门精度回暖的趋势还是很明显的 :
那么,为什么C罗在图中的位置还不如18-19赛季那么好看呢?其实C罗的“射门选择提升值”和“射门精度提升值”比上赛季还要进步了,之所以在图中的位置离右上角反而更远,原因在于意甲出了三尊大神,给数据标准打上去了——因莫比莱、卢卡库和哲科。
这其中尤其要提到的是因莫比莱,此人这赛季确实是大爆发,射门又多又准,而且拉齐奥除他之外也真的拿不出什么像样的得分手。相比之下,卢卡库身边还有个劳塔罗,而哲科则干脆自身的射门精度奇差。因莫比莱的表现也确实给C罗带来了很多舆论压力。然而很多人在拿因莫比莱指责C罗的时候,却没有意识到:因莫比莱本赛季打出的实际上是顶级前锋的数据——他这赛季的真实射门得分率是恐怖的9.40%。如果你们对这个数字没有概念,那我随便提供几个顶级前锋的数据:
莱万多夫斯基本赛季是7.13%;瓦尔迪是10.26%;梅西是5.66%。
C罗准确讲不是“和因莫比莱对比”,而是“和最好赛季的因莫比莱去对比”。这本身实际上就隐含一个“C罗必须挑战最好”的含义了。
要知道,就在今天,C罗已经35岁了。一个35岁的前锋被舆论拿来和因莫比莱比射门,是不是这本身就意味着,舆论对他的要求,是“你要做到最好”?
相信我,如果你从事一个职业,到了这个职业圈里多数人都在考虑退休甚至已经退休的年龄时,还在被要求“做到最好”,那无论你有没有做到,你都已经是这个职业当中历史级的王者了。
当然,文章的末尾还是要回归主题——数据的最大魅力就在于,它能够帮我们一层一层的去伪存真,去深究我们之前一些认知的正误。而当我们换一个参考系,把“球员之间的直接对比”,变成“球员结合所在环境的对比”后,就会得出完全不同的数据结论。这是我第一次尝试这样做,在我平常看到的足球数据类文章中,也没有发现哪个老外这么尝试。还是那句话,足球数据应用,目前的门槛非常低,每个人都可以去尝试着做,我们完全不用妄自菲薄的等着欧洲人去做。
即便我们不能拥有最好的职业足球从业环境,但也至少可以率先拥有一个不断求知,而非不断撕逼的足球讨论环境。这也是本专栏的最大追求。