Jay Boice这么写道:“对我们实时模型背后的数据的探索证实
预测结果,是世界杯看球的一大乐趣。章鱼保罗就是靠在2010年南非世界杯成功猜对了8场球赛,而被大家称作“预言帝”。如今,随着算法技术的成熟,人工智能(AI)也来凑热闹了。
我们统计了4家知名度较高的机构发布的预测,发现包括调研公司尼尔森(Nielsen)、游戏公司艺电(Electronic Arts)和统计网站538(FiveThirtyEight)在内的3家都说,能捧起这届世界杯大力神杯的会是阿根廷队。唯一持不同意见的是卡塔尔半岛电视台的AI卡谢夫(Kashef),它觉得法国队有51%的概率能夺冠。
艺电已经为他们预测的冠军阿根廷队制作好了胜利画面。图片来源:EA Sports
这么多AI都说阿根廷队要赢,结果就是板上钉钉的吗?
其实早在前几届世界杯,很多团队就运用起AI来预测世界杯结果,只是大多数的正确率都惨不忍睹。例如上一届世界杯的冠军法国队,根本不在西班牙、德国、巴西这些各家算出的夺冠热门里。
但我们统计了艺电、半岛电视台、538和尼尔森这4家今年预测的晋级名单,其应验率基本在70%左右。相比高盛公司的AI在上一届世界杯只有56.7%的预测准确率、且冠亚季军全部脱靶而言,这个成绩已经进步了不少。
AI是如何料事如神的?
那么,这些人工智能是如何拥有未卜先知的“神秘力量”的?毕竟,如果预测原理无法用科学解释,那么和章鱼保罗的玄学就没有多少区别。尼尔森只有一句简单的“预测是基于超过一百万次的模拟”原理解释,就很难让人信服。
比如从1993年起就和国际足联合作推出足球游戏的艺电,将自己的预测能力归功于能体现真实比赛的《FIFA 23》游戏,他们用模仿各队打法的AI球队反复推演了64场比赛。艺电用这套不明觉厉的方法,成功预测了2010年、2014年和2018年的世界杯冠军,以至于如今自信到从开赛以来就没更正过预测结果。只是它还预测过这届世界杯,巴西队会和阿根廷队在决赛圈会合,但这支南美强队实际上连四强都没进。
再比如,来自本届世界杯东道主的半岛电视台,其预测原理则是分析参赛的32支球队的历史表现,包括过去一个世纪的比赛胜率、进球数和国际足联排名的十万条记录,从而作出的预测。但这就解释不了为什么他们的AI会预测法国队将险胜阿根廷队,因为两支球队在历史上的12次交锋中,法国队只赢了3场。
半岛电视台将AI用于分析的历史资料用可视化的形式向读者展现。图片来源:半岛电视台
相比之下,统计网站538对自己预测的解释就丰富详实得多。
和半岛电视台一样,538也是基于对过往比赛成绩的分析来做出的预测。他们收录了自 1905 年以来所有国际足球比赛的数据,从球队近期的表现算出攻防能力,同时还跟踪了各个参赛球员在俱乐部和世界杯的表现,并分别按 75% 和 25% 的权重算出各支球队的足球实力指数(SPI)。例如本届世界杯32支球队中,指数最高的巴西队有93.5分,一度也是夺冠热门,指数最低的是东道主卡塔尔队,只有51.0分。
但最终的比赛预测结果并不是根据足球实力指数简单对比得出,这套算法的作者Jay Boice以2014年世界杯的揭幕战巴西对克罗地亚为例解释道:考虑到主场优势,巴西队进多球的概率非常高,而克罗地亚队进1球甚至不进球的概率比较高,从而综合计算出巴西队获胜的概率高达86%。最终的结果也如他所料,巴西队以3:1的成绩拿下开门红。
本届世界杯,538的算法中,也同样为卡塔尔队增加了约0.4个进球的主场优势,并为亚足联的所有队伍应用了约三分之一的主场优势。
除了主场优势,538的模型还考虑到了红牌、加时赛等影响,尽管如此,能影响足球比赛结果的变量还是太多,天气、士气、场地都会有影响,甚至有的球队还有轻敌、放水等AI不一定能理解的行为。
比如算法曾预测在本届世界杯小组赛上逆转了德国队的日本队,会以59.6%的胜率轻松击败哥斯达黎加队,毕竟后者都被西班牙队虐到了0:7,但实际赛中,日本队在上半场有所保留,在下半场才换上了进攻主力,结果输掉了比赛。
Jay Boice也提过,如果只是每4年才64场球赛数据的世界杯,真不够他们“喂养”模型来提高精准度。
所以,哪怕各家AI预测的晋级名单准确率已达到了70%,但具体到每一场比赛的预测结果,依然没有那么高。除了预测冠军,半岛电视台和538还对每一场比赛的输赢进行了预测,截至目前已经结束的63场球赛中,半岛电视台的人工智能预测对了37场,538则是36场,命中率都只有50%多。
但需要说明的是,算法模型给出的只是发生各种情况的可能性,可能性最高的情况也并非一定会发生。哪怕是有90%的几率获胜,也代表有10%生变的可能。盘点这届世界杯每一场比赛后就会发现,胜率越接近的时候,AI的预测可能越不准。
看球的一大乐趣,就是拥抱不确定
所以,不论是538预测阿根廷队有53.2%的概率获胜,还是半岛电视台扬言法国队有51.0%的几率捧杯,不到终场哨声吹起的那一刻,谁都不知道最终结果。
而且这可能并非是一件坏事,就像高盛公司在2018年世界杯预测报告的序言最后所写的那样:
“尽管我们使用了最先进的统计学方法、考虑了各种层面的信息、甚至想到了比赛中的随机性,但预测结果仍然是高度不确定的,因为足球比赛本身就是不可预测的。这或许就是为什么观看世界杯会这么令人激动。”
回顾这届世界杯,你会发现,那些AI预测结果被“打脸”的球赛,往往都是大家最津津乐道的比赛。不管是小组赛里,日本队、韩国队这些亚洲球队踢赢德国队、西班牙队、葡萄牙队这些欧洲强队,还是1/4决赛上,克罗地亚队靠点球大战送走本届夺冠热门巴西队,都成了这届世界杯令人难忘的比赛。
而且如果你看过这几场比赛,或许会发现它们还有一个共同点:那就是获胜者都是在丢了一球的情况下,实现了反超。
事实上,AI也能捕捉到了这一点。538团队在分析过往球赛时发现:优秀的球队在丢球后的进球率,往往高于预期。Jay Boice这么写道:“对我们实时模型背后的数据的探索证实,任何落后一球的球队在之后的得分率,往往高于之前的得分率,而比分落后的球队越好,影响越大。”而最让人们激动的比赛,也通常是那些大家看好的球队落后一两个球后奋起追击的比赛。
毕竟,比起强者虐菜、弱队连跪,多数人更喜欢看的是旗鼓相当的对决。
张轶君对文本亦有贡献
评论