网罗全网热门赛事

量化门将能力:用 XCG 和限制对手射门得分率解析四大联赛门将表现

大约10天前,我发表了一篇用高端数据“实投得分率”来量化前锋的文章:《三张高端数据图表告诉你:本赛季三大联盟谁的出手质量和数量”,也许是因为插画的缘故,我才有幸得到了大家的支持。今天,我们用类似但不完全相同的方法英超门将最快进球,对英格兰、西班牙、意大利、德国四大联赛的门将进行量化,看看哪位门将最受对手射门考验,哪位门将解决问题的能力最好。危险的情况。 。

超长介绍:XCG是什么?什么是“限制对手射门”?

其实本赛季之初我就已经在直播论坛上普及过类似的概念(详细请看高级数据报告:如何量化门将能力?纳瓦斯比库尔图瓦如何更好?),但本赛季并没有普及当时。该数据用作最近的样本。其次,我们并没有采用散点图的方法,将每个联赛的所有门将都画在一张图表上来实现数据的可视化阅读。因此,我们只能实事求是地讨论一些知名球员。守门员。我们知道,一名球员在场上的表现必然会有起伏,数据层面的表现也会随之发生变化。三个月后,我们来回顾一下本赛季的门将表现,再次系统地和大家聊聊球队门将的量化。 ,这实际上是必要的。事实上,这样的量化和散点图的呈现应该定期进行,这样才能清楚地掌握每个门将的发展趋势。

首先,这种量化方法使用的核心数据是“预期失球数”(Goal,简称XCG)。这是一个与预期目标有些相似但又非常不同的跟踪统计数据。它考虑的不是每一次射击,而是每一次击中目标。换句话说,看似质量极高并击中门柱的射门,其 XCG 为 0;而弱且容易被守门员化解的射门,其XCG则大于0。该数据的价值在于:守门员的所有扑救都瞄准了球门。事实上,基础统计也是如此。 “扑救”的概念记录了“扑救对方击中目标的射门”。

一旦射中目标,数据公司就会使用多角度视频,结合射击速度、角度、距离、射击方法等多种因素,参考数十万次击中目标的结果。过去几年的目标。大数据计算出这次射门的进球概率。这是XCG。注:XCG和XG(预期进球)最大的区别在于,前者量化“射门后”,后者量化“射门前”。换句话说,前者量化了击球的质量;后者量化了击球的质量。后者量化了射击的难度。让我在这里给一个。先看一下下面两张图:

英超门将绝杀_英超门将直接进球_英超门将最快进球

如果我问你,上面两个镜头哪一个更难?恐怕大家都会说萨拉赫的远射难度大很多。但这么说的前提是,我们问题的整个内容是“哪个投篮对于射手来说更困难”,也就是说,如果我们量化这个背景下投篮的难度,我们量化的其实是概率“在射门之前”进球。 XG对此给出了符合常规看法的结论:斯特林近距离推射的XG为0.25,这意味着进球的概率为25%;而萨拉赫的远射XG仅为0.04,这意味着进球概率为25%。 4%。

然而,如果我们换个角度,站在门将的立场上,结论就完全不同了:在不考虑位置选择因素的情况下,斯特林的射门明显太直,球速不快;萨拉赫的远射被公认为“世界波”。因此,如果我们问“哪种射门对于守门员来说更难应对”,定量结果必然会完全不同。 XCG给出的结论是:斯特林近距离射门的XCG为0.48;而萨拉赫的远射XCG为0.59。换句话说,扑出萨拉赫射门的门将比化解斯特林的射门更值得赞扬。这就是为什么该网站使用XCG作为“守门员数据”而不是“前锋数据”。

说白了,XCG的目的就是告诉你守门员面对的每一次射门射门是多么困难。 XCG越高,保存就越困难。

那么,有了XCG数据,我们如何利用它得出进一步的结论呢?我在这里“发明”了一个概念,叫做“限制对手进球率”。其核心目的是计算“守门员每次面对对手的射门,能够将对手的进球概率降低多少”。算法为:“限制对手进球率=(XCG-实际失球数)/对手射门次数*100%”。显然,保存难度越高、XCG越高,该算法的优势就越大。那些“神扑”在这里意义重大。

之所以将“发明”一词加引号,是因为虽然这个概念确实是我自己提出的,但思想其实并不复杂。国外甚至国内其他人可能也这么做过。也欢迎大家用这个算法来分析更多的联赛数据。事实上,有媒体已经用这个算法来分析中超门将。当然,他们在使用的时候,也确实表明是我提出来的。

以“限制对手投篮命中率”为定性维度后,下一步就是“量”的衡量。这里我用的是“每 90 分钟对手射中目标的次数”。当然,你也可以使用“每90分钟扑救”,但我更喜欢考虑守门员“受到考验”的次数,而不是他“尝试解决考验”的次数。每一个高层数据都代表着数据创造者的价值观。欢迎大家提出更多算法,让尚处于起步阶段的足球数据应用变得更好。

还需要指出的是,该算法的目标并不是量化“谁是更好的守门员”,而只是关注扑救的水平。 “进攻”、“选位”甚至“辅助传球控制”等环节都不在这个算法的考虑范围之内。并且也存在一些算法无法解决的问题(文中会给出具体案例)。但数据从来都不是“可以解释一切”的绝对标准。它只是一个“具有重大意义”的工具。例如,螺丝刀永远不能用来代替钳子,但有了螺丝刀,你就可以和钳子一起使用,做出更好的产品。数据和视频从来不冲突,它是视频的补充。所谓“不用数据,看球的人都知道”更多的是争论而不是求知。

一场英超联赛

英超门将直接进球_英超门将最快进球_英超门将绝杀

横轴是“限制对手射门率”,纵轴是“每90分钟对手射门次数”。点越大,播放时间越长。这里我做了纵轴“数量”,横轴“质量”,因为“数量”的维度数据相对来说更加离散,这样的形状更有利于手机阅读。

这里有些遗憾的事情是,英超迄今为止最能平衡“质”与“量”的门将——洛里——遭遇了重伤。此人受伤前对球队的意义可能不亚于孙兴慜。事实上英超门将最快进球,洛瑞长期以来一直被有些低估。上赛季他的“限制对手投篮得分率”甚至比本赛季还要高,为7.98%。他是继阿利森之后的英超第二门将,但每90分钟每分钟只允许射正3.86次,这意味着他所承受的考验比本赛季要少得多。洛瑞本赛季射正次数突然增多,很大程度上是由于热刺前期防守莫名其妙的低迷所致。球队在中场逼抢频频失败后,很少有人回追掩护防守,导致对手在极具威胁的区域形成射门。这也给了洛瑞足够的表现机会。例如下图中,xcg高达0.61:

英超门将直接进球_英超门将最快进球_英超门将绝杀

此外,今年英超还有一个特殊现象:横轴顶端的两位门将小舒梅切尔和西班牙天才瓜伊塔,似乎都拥有极其可怕的“限制对手射门率”。但这其中也有一定的运气成分,尤其是对于瓜伊塔来说。超过10%的惊人数据,有些“扑救”其实是非常偶然的。我们看下面两张图:

英超门将最快进球_英超门将绝杀_英超门将直接进球

英超门将绝杀_英超门将直接进球_英超门将最快进球

两次射门的XCG都是高得吓人的0.80——要知道点球命中只有0.81。而且,舒梅切尔和瓜伊塔都没有让对手突破,但问题是,这两次射门都没有被他们扑出,而是在门线上被队友挡出。这就是XCG的统计数据的问题。它不考虑“扑救”动作是否完全发生,而只考虑射击是否击中目标。当然,如果样本足够大的话,这个缺点其实可以忽略不计,但问题是目前的样本是否足够大还很难说,特别是考虑到一些上场时间较少的门将之后。

当然,这并不意味着舒梅切尔和瓜伊塔能够打出这样的数据只是因为运气。他们本赛季确实做出了非常好的扑救。接下来的两次射击均命中目标,XCG 分别为 0.67 和 0.70。能够解决这样的一击所获得的加成是非常可观的:

英超门将绝杀_英超门将直接进球_英超门将最快进球

英超门将绝杀_英超门将最快进球_英超门将直接进球

最后值得注意的是:一些著名门将本赛季几乎以各种方式失败。其中阿利森的出场时间太少,未来还有很大的修正空间。但德赫亚、埃德森和凯帕就比较尴尬了。比如德赫亚,从2018年世界杯之后突然从神界跌落到人间,此后的状态就非常不稳定。以下两个进球的 XCG 分别仅为 0.18 和 0.36。错过这两个进球,对于德赫亚来说将会产生非常负面的影响。他曾经以惊人的反应速度而闻名的现在已经下降了,他的远投似乎也没有太大的进步。

英超门将直接进球_英超门将绝杀_英超门将最快进球

英超门将绝杀_英超门将最快进球_英超门将直接进球

另一个值得关注的人是凯帕。从今年的情况来看,切尔西创纪录的转会费至少目前来说绝对不值得。说凯帕是英超最差门将也不为过。但也有一定的运气成分——折射。看看以下两个目标:

英超门将绝杀_英超门将直接进球_英超门将最快进球

这两次射门居然变线了,这对门将来说是一个很大的考验。然而,这两个镜头的XCG分别仅为0.04和0.08。我知道这是不公平的,但问题是:目前还没有数学模型可以准确地反映这条折射线的影响。你甚至无法判断射门后球在飞行过程中击中防守球员是否对守门员有利。但还是有缺点——它确实会让守门员在一开始就无法判断球的路径,而且确实会让守门员措手不及;但问题是折射也会减慢球的飞行速度,也可能使瞄准盲角的击球变得更差。它变成一条朝向守门员的抛物线。这是目前所有以XCG为核心的算法都无法避免的问题。同样,足够大的样本会无限淡化这个运气成分的影响,但当样本不是那么大时,这个运气因素仍然不能忽视。

2 西甲联赛:

英超门将最快进球_英超门将直接进球_英超门将绝杀

横轴是“限制对手射门率”,纵轴是“每90分钟对手射门次数”。点越大,播放时间越长。

本赛季的西甲基本印证了那句话:弱队出局。位于右上角最“光彩”区域的费尔南德斯和雷纳分别效力于莱万特和马洛卡。两队是西甲对手预期进球数(XG)前两名的球队。尤其是莱万特的防守就像纸一样。费尔南德斯可以说是西甲排名第9的功臣。

这两支球队本赛季的一大特点就是经常给对手大量的射门机会。这也是我一直主张不要用狗屁的“零封印”数据来衡量门将的原因之一:像雷纳和费尔南德斯这样的门将,一场比赛往往要被对手射正十几次,而他们承受比豪门球队更多的考验。门将们的比赛时间都在两三场以上,因此以“零封印”为标准忽略了他们工作量的巨大差异。费尔南德斯本赛季已经被5支球队射正超过10次,而雷纳在代表马洛卡对阵巴萨时就被对手射正20次……指望他们“不失球”确实很难对抗他们的对手。另一方面,一旦引入XCG进行计算,即使丢球,我们也能最大限度地认识到守门员的扑救水平。

比如下图:皇马一轮其实射门两次(中间一次算传球),第一次被扑出,第二次进球。费尔南德斯这次丢球了吗?当然,球掉了。但谁能说他表现不好呢?维尼修斯两次出手,XCG分别高达0.68和0.66;费尔南德斯的“限制对手投篮命中率”在本轮取得了巨大的加成:

英超门将最快进球_英超门将直接进球_英超门将绝杀

另外值得注意的是三大俱乐部的门将:我只能说,今年在一个小样本中,西甲门将确实发生了变化……库尔图瓦一扫几个赛季和本赛季初的颓势。 (你没看错,这个人在切尔西的时候表现也不好,他在马竞的时间太长了,数据无法查。)他打出了近年来最好的表现。不过,上赛季跻身欧洲前两名的门将特尔施特根和奥布拉克,本赛季却有些疲软。其中皇马和马竞整体防守较好,门将没有经历太多考验;特尔施特根的射正次数相对较多。

具体来说,三人的情况各有不同。

至于库尔图瓦,皇马球迷其实还是很期待的,因为他限制对手的进球率在本赛季开始后有所提升,终于出现了相对稳定的上升趋势:

英超门将最快进球_英超门将绝杀_英超门将直接进球

库尔图瓦最大的进步就是面对对手反击时表现非常出色。结合皇马后防线往往位置较高的情况,库尔图瓦的表现可以算是对球队的补充。以下两个镜头的 XCG 分别为 0.60 和 0.70。库尔图瓦能救回来,无论是个人数据还是球队表现,都是一笔相当可观的正加成:

英超门将最快进球_英超门将绝杀_英超门将直接进球

英超门将绝杀_英超门将直接进球_英超门将最快进球

至于奥布拉克,本赛季小样本确实有一定程度的回归,尤其是一些中等难度的球,奥布拉克不应该放过。例如,接下来的球的XCG仅为0.37。以奥布拉克的水平,不太可能放过:

英超门将直接进球_英超门将最快进球_英超门将绝杀

当然,作为西甲射门次数第二低的门将,奥布拉克的扑救样本还是有点少。随着样本量的增加,不排除后续修正的可能性。

最后还有特尔施特根,他也有点“背”:他错失球的次数很多,但视野实际上被挡住了。例如,以下两个目标的 xcg 分别仅为 0.04 和 0.15。进球对于特尔施特根来说是极为不利的。从随后的反应来看,特尔施特根应该无法第一时间看到球的飞行轨迹。

英超门将最快进球_英超门将直接进球_英超门将绝杀

英超门将最快进球_英超门将直接进球_英超门将绝杀

这就涉及到XCG的另一个问题:我们都知道视野受阻对守门员极为不利。不过,后卫在挡住门将视线的同时,也挡住了对方的射门角度。遮挡角度很容易在相机上清晰地看到和量化;但视线是否被遮挡以及遮挡了多少?如何判断?在目前的技术条件下,这一点根本无法深入考虑。特尔施特根遭受了这次损失。至于如何避免这种情况,同样,任何高级数据最需要的是足够大的样本。

3 意甲联赛:

英超门将绝杀_英超门将直接进球_英超门将最快进球

意甲最大的亮点颇为唏嘘:尤文图斯成就了门将遗志——什琴斯尼是意甲最能兼顾“质”与“量”的门将之一,而布冯恐怕是最差的……

事实上,什琴斯尼这两年或多或少都生活在布冯名声的阴影之下。和洛里一样,上赛季他都比本赛季打出了更好的水平,但本赛季由于球队整体防守下降,导致表现机会增多。上赛季什琴斯尼拥有7.39%的超高“限制对手射门得分率”,但每90分钟对手射门次数仅有2.92次;本赛季这个数字已经飙升至5.08次——单从这一点来看英超门将最快进球,很多尤文球迷对萨里的不满,确实是有原因的……

至于布冯,他本赛季的表现确实让人暖心:即使是门将这个特殊的位置,他也永远无法与时间抗衡。下图中的镜头的 XCG 仅为 0.17。布冯看似已经扑出了球,但他还是让皮球滚入了球网。这在他年轻的时候是不可想象的——我是说年轻,也许在38岁之前。

英超门将最快进球_英超门将直接进球_英超门将绝杀

另外,米兰球迷心中百感交集的多纳鲁马本赛季的表现其实并不合格。当然,米兰的问题不仅仅是多纳鲁马,他甚至不是米兰排名的问题。这也是一件悲哀的事情:曾经拥有无数粉丝的豪门如今千疮百孔。这个时候,再担心多纳鲁马已经没有太大意义了。

4 德甲联赛:

英超门将绝杀_英超门将最快进球_英超门将直接进球

德甲联赛中最受关注的球队当然是拜仁。恰巧的是,门将位置也恰好是拜仁最近非常有趣的一个方面。就目前的情况来看,我真的感觉几年前的情节又会重演。拜仁将从沙尔克招募一名非常优秀的门将,但这次的替代者将是他们上次从沙尔克招募的门将......

是的,诺伊尔本赛季出场时间不少,但他的扑救表现并不理想。 “限制对手投篮得分率”是令人尴尬的-3.76%;相比之下,努贝尔发挥了不错的2.26%。 “限制对方的进球率。”下面的镜头的 XCG 仅 0.06。考虑到诺伊尔的名声,诺伊尔错过这次射门确实不合适:

英超门将最快进球_英超门将直接进球_英超门将绝杀

当然,我承认诺伊尔在传球控制和覆盖范围方面仍然是门将中最好的。但问题是,如果核心工作没做好,传控领域的加成还那么重要吗?要知道,并不是每个教练都像瓜迪奥拉那样注重传球和控制。以他本赛季所展现的扑救水平,诺伊尔不能说他在任何情况下都一定会成为主力球员。相对而言,努贝尔本赛季的表现显得“元气满满”。下图中,有两个镜头。第一次扑救并不困难,但随后对手第二次射门正中目标。 XCG高达0.74。努贝尔的反应速度和身体素质在连续第二次扑救中得到了充分的展现。 :

英超门将最快进球_英超门将绝杀_英超门将直接进球

事实上,在任何足球场上,没有一个位置是绝对稳定的。逆水行舟,不进不退,是最常见的现象。如果诺伊尔真的被努贝尔取代,也不必感到惊讶。

有一个事实可能会让大家惊讶:门将位置看似稳定,只是因为过去的“失球数”和“零封印”数据太具有欺骗性(再次呼吁所谓的“零封印”数据被彻底抛弃,顶多是个噱头),这位富有的门将整场比赛都没有流过汗,当然丢球也很少。以这样的数据来衡量,“看上去状态稳定”并不难;而弱队的门将,屡屡立下奇功,往往会有“哇哦,这个人作弊了”,然后被遗忘的经历。我们引入XCG来量化守门员的扑救水平,我们的目的就是颠覆这种极具欺骗性的传统评价体系。而如果你列出一个门将近几个赛季的“限制对手射门得分率”,你会发现一个门将要保持稳定的表现是多么困难——这比前锋保持射门、中场保持传球成功还要困难速度。困难得多。

遗憾的是,XCG的数据已经存在不久了,只保留了最近四个赛季的数据。我们无法检查卡西利亚斯、布冯等限制对手的门将的进球率。但足球数据的应用本身更着眼于未来。引入新的分析工具的最大意义在于修正过去的方法论,而不是验证过去的某个具体观点。

(半夜花花嚎叫)