网罗全网热门赛事

如何赢得英超:足球数据革命与亲眼观察的重要性

无论足球数据分析技术发展到什么程度,第一手观察始终是必不可少的。

作者丨橘猫看足球

编辑丨华晓兰

利物浦研究主管伊恩·格雷厄姆博士今年出版了一本新书,《如何赢得英超联赛:足球数据革命的内幕》。这位毕业于剑桥大学的博士学位。 2012 年至 2023 年期间,他获得了物理学博士学位,之后创立了一家体育咨询公司。这些年,他在红军工作期间,创立了英超第一个内部数据分析部门,见证了利物浦在芬威体育集团麾下从休眠到复兴的整个过程。

书中除了讲述格雷厄姆个人在利物浦的成功经历外,还介绍了足球数据科学的基本概念,并解释了他对一些公众喜闻乐见的热门话题的独特见解,例如第12章“历史上最好的一场战斗” 》,从数据角度给出了梅西C罗谁是“GOAT”的答案。

今天我们就从这个通俗易懂、备受关注的话题开始,一睹数据分析的奥秘。

有史以来最好的?

遗憾的是,由于数据条件有限,我们无法利用今天的分析模型对贝利和马拉多纳、甜瓜等历史巨星进行深入比较。事实上,就连梅洛自己职业生涯早期的表现也没有被完全覆盖——英国体育数据提供商Opta在2007年开始出售“赛事数据”,当时C罗已经为曼联效力了四个赛季。 ,梅西已经获得了金童奖。

但即便如此,我们也不难发现,两个甜瓜能够在近20年的时间里保持巅峰竞技状态,这是前所未有的。贝利时代的职业足球比赛体系远不如今天发达,马拉多纳在欧洲的职业生涯也只持续了11年。

将采样范围限制在顶级赛事(五大联盟、欧洲比赛和正式成年国家队比赛),截至2024年5月,C罗在81594分钟的出场时间里打进了755个进球和272次助攻(每90分钟1.13个进球和助攻)。梅西在72313分钟的出场时间里打进690个进球,送出339次助攻(每90分钟1.28个进球和助攻),场均进球数超过1个。

还有一个人可以勉强与之匹敌,那就是仍在顶级联赛效力的莱万多夫斯基。他平均每90分钟打入1.09个进球并助攻1.09个,与克里斯蒂亚诺·罗纳尔多相差不远——56,458分钟内攻入517个进球。 166 援助和计数。

其他候选人呢?内马尔和姆巴佩效力于竞争力较弱的法甲,这降低了他们的数据价值;苏亚雷斯和伊布拉莫维奇都很出色,但他们在荷甲待得太久了;大罗(罗纳尔多和小罗)最遗憾的就是伤病和职业生涯的长度。

是的,如果你想成为山羊,你首先必须“耐用”。 C罗在顶级联赛场均出场时间接近3900分钟,梅西也超过3800分钟,而最接近两人的莱万多夫斯基出场时间超过3500分钟,这也令人印象深刻(尤其是考虑到德甲联赛轮数较少) 。

24岁的哈兰德是“后梅罗时代”足坛王的有力竞争者。他的193个进球和41次助攻,平均每90分钟1.3个进球和助攻,令人惊叹。然而,他只打了五个赛季。未来想要匹敌甜瓜,首先要有耐力。

哈兰德会成为下一个“纪录打破者”吗?

进球和射门

说到甜瓜,就不得不提两人恐怖的得分能力。就总进球数而言,C罗遥遥领先,但就效率而言,梅西每90分钟0.86个进球优于C罗的0.83个进球。

除了在顶级赛事中踢球的时间更长外,C罗的点球主罚能力也更好,点球转化率比梅西高出3.5%。由于点球主罚者往往不是点球制造者,而点球有时更考验他们的比赛能力而不是射门技术,或许我们可以从去除点球的角度来观察两人的得分能力。那么梅西每90分钟0.74个进球的效率甚至比C罗(0.68个进球)还要高。

数据分析当然不止于此。就像上面对“进球=出场时间×进球率”的拆解一样,踢球次数和射门精准度也是构成进球的因素。

C拉塞尔以“无限的出手权”而闻名,他场均近5次的出手也印证了这一印象。梅西的射门次数也不低,场均接近4次射门。

我们可以用“预期进球”的概念来帮助判断踢球的时机。预期进球(Goal,xG)使用历史海量射门统计数据来计算射门得分的可能性,从而衡量机会的质量。 C罗的预期进球转化率(xG÷总射门)为11%,低于梅西的14%。这意味着C罗对于自己踢球合理性的把握不及梅西,或许是因为他更熟悉突破性进球。长镜头更加持久。

这导致C罗击中门框的准确率不到40%,也低于梅西的46%。这方面有更先进的工具。格雷厄姆喜欢用自己开发的“射门后预期进球(Post-xG)”。考虑射门轨迹后,可以更好地衡量前锋抓住机会的能力和守门员扑救的能力。梅韦斯特的xG转化率进一步提升,而C罗则相反,这进一步证明了两人射门精准度的差异。

这也符合印象流。梅西更喜欢四二冲推球,而C罗则崇尚“暴力美学”。他们都达到了预期的结果。梅西的实际进球转化率比xG转化率高出18个百分点,C罗则高出13个百分点,这也非常不错。同样的特点也体现在任意球方面。

当然,从“进球技能包”的多样性来看,C罗显然是更全面的。葡萄牙人大约有1/6的射门是通过头球完成的(梅西只有1/18),还有大约1/5的射门是通过头球完成的。反脚射门(梅西只有1/6)。

传球和创造力

助攻方面,梅西在顶级比赛中的助攻数达到了339次(每90分钟0.42次助攻),高于C罗的272次(每90分钟0.3次​​助攻)。效率超过40%,传威胁球的能力有所提高。显然阿根廷队更强。

得益于巴萨tiki-taka风格的加入,梅西场均传球次数比C罗少一半,也是顶级赛事中传球次数最多的前锋。

从这些数据来看,梅西显然是一名更好的团队球员,但要衡量一名球员的行为对球队的“价值”,我们需要更先进的工具。

梅西2022年世界杯的传球数据

格雷厄姆多年前就提出了“控球价值模型”,后来逐渐被业界接受和使用——球队在球场上不同位置和条件(正常、防守、定位球或反击)下控球。上述情况有不同的影响。只有增加最终进球概率的控球才有价值。这就是“控球值(PV)”。

计算PV需要用到统计学中的“马尔可夫链”。对于特定位置、特定状态下的控球,模型根据海量历史数据计算下一步发展的各种可能性,并逐步推导出最终结果。进球或失球的概率。

当球员通过传球或带球将球从一个位置转移到另一个位置时,例如梅西将直塞球传到禁区中央的罚球点,PV也会相应增加,因此可以衡量一个球员的贡献给球队带来的除了进攻,助攻还是非凡的成功。

事实上,该模型还可以衡量其他球员行为对进球或失球的影响,包括但不限于射门、抢断、犯规等。尽管有很多局限性英超足球数据,PV模型在球员评估方面表现良好。利物浦2018/19赛季欧冠决赛首发阵容中,除了已经入队的亨德森和青训球员阿诺德之外,其余9名球员均来自模范选拔。 。

德布劳内增加PV的案例

回到梅罗之战,梅西通过传球增加的PV处于世界顶级水平,所以当我们看到一位“大师”10号球员在职业生涯末期也就不足为奇了。

“双骄”都是顶级带球大师,但众所周知,梅西的带球能力是顶级中的顶级。他不仅传球次数出色,带球创造的PV附加值也是C罗的两倍。或许转型前的“小罗纳尔迪尼奥”不会有这么大的劣势。

虽然两人都是历史得分手,但高效的梅西在“控球价值模型”中被评为更高,因为通过射门制造球门威胁的另一面是结束球队对球的控制并增加失球数。风险,也剥夺了其他玩家创造PV的机会。射门次数并不是越多越好,球队的“进球者”也不是越多。

可以说英超足球数据,从PV来看,梅西几乎在所有方面都胜出。

除了射门,梅西的多才多艺

梅西“行走”

C罗和梅西在队内都享有“不用回防”的特权。遗憾的是,由于缺乏球员轨迹数据,我们无法评估两人职业生涯大部分时间的跑动情况。

英超联赛在2016年向俱乐部开放了所有比赛的球员轨迹数据,可以看出,36岁的C罗第二次为曼联效力时跑动并不多,但他的冲刺速度仍然可以与年轻球员的情况。也许他早年的冲刺速度和距离是现象级的,但无法用数据证实。

一般来说,跑动较少的前锋球员会像C罗那样用更多的冲刺来弥补回防的不足,但梅西却是出了名的“不爱跑动”。他不但跑得不多,连冲刺的次数也少了。 ,从而引来不少批评,但这似乎并不是他职业生涯末期的堕落现象。

梅西在2014年世界杯上的跑动距离“独一无二”

为什么这样一个“懒”的玩家能取得如此伟大的成就呢?仅仅是因为他历史悠久的球技吗?

2018年,效力于巴塞罗那的知名数据科学家哈维尔·费尔南德斯( )和红鸟资本共同所有人卢克·博恩(Luke Born)发表了一篇题为《开放空间:衡量职业足球空间创造的统计技术》的论文。 “音高控制(Pitch)”的概念是为了探索玩家对空间的创造和利用,以及空间的价值而产生的。

虽然大多数球员通过远离防守球员或积极跑入无人占领的区域来创造空间英超足球数据,但梅西却恰恰相反。他三分之二的“宝贵”空间是通过站立或行走创造的。创造出来的,有的在高速移动时突然减速,有的只是看似无意的漫步……

瓜迪奥拉曾表示,梅西会在比赛的前几分钟观察对方防守的空间和球员的防守倾向,然后再开始移动(san),这可以解释他在比赛初期的进球。一个较小的现象——C罗的进球中有8%是在比赛的前10分钟产生的,而梅西的这一比例只有5%。直到去年的中国之行,梅西才在比赛的前两分钟就打进了自己的第一个进球。

2022年世界杯球员“行走”名单

结论

谁是格雷厄姆的山羊?答案很明显,但这不是最重要的。如何通过数据的角度观察和分析足球比赛,是他想要传达的思想核心。

事实上,格雷厄姆在书中大力宣扬数据分析的同时,也从未错过对其局限性的辩证讨论。比如梅罗惊人数据的背景,梅西并没有像C罗那样经历过三大联赛的训练。尤其是对粗暴行为的处罚最为宽松的英超联赛,但C罗也从更加“水”的国家队比赛中受益——在列支敦士登、安道尔、塞浦路斯等同级别对手身上取得了47个进球和13次助攻。卢森堡。梅西在南美遇到的最“轻松”的比赛是在高海拔地区。玻利维亚拥有海拔 3,637 米的高原。

格雷厄姆认为,无论足球数据分析技术发展到什么程度,个人观察始终至关重要。在利物浦期间,数据分析主要用于筛选转会目标和评估比赛内容。视频分析从来不缺席。

无论如何,双骄为后人树立了难以逾越的标杆。如今,足球界的两极分化日益明显,豪门家族的统治力越来越强。新一代巨星有了一个追赶前辈的舒适环境,剩下的就看他们自己了!