据悉,在世界杯淘汰赛中,被多个AI大模型看好的德国队爆冷出局。其中,Kimi在赛前基于300个子Agent的分析,认为德国队被市场低估,其校准后夺冠概率约为11.3%。然而,德国队最终在点球大战中不敌巴拉圭,止步32强。
更值得关注的是,在联想与咪咕发起的“世界杯预测人机大战”中,包括Kimi、DeepSeek、通义千问、百度文心、腾讯混元在内的12个主流AI模型,全部预测德国队将获胜。这场集体的预测失误,将AI模型在现实复杂场景下的判断可靠性问题推至台前。
分析指出,德国队作为传统强队,其历史、球星、体系等“强队标签”过于醒目,容易让模型产生安全感,从而可能放大了其先验优势。而巴拉圭队“将比赛拖入点球”的务实路径,恰恰是AI模型容易低估的“窄路”。足球比赛的结果由“谁活下来”决定,而非简单的“谁更强”。
此次事件为AI模型提供了一个公开检验的契机。关键在于,AI公司能否诚实地复盘错误,而非仅用“不确定性”一言蔽之。Kimi在预测原文中已声明“我们的预测很可能是错的”,如今这成为对其自身的追问。AI进入现实世界,最重要的能力不仅是回答问题,更是如何处理公开的错误,这将决定其能否赢得更深层次的信任。

粤公网安备 44010602000162号
网友评论