在德国与巴拉圭的世界杯淘汰赛中,四届冠军德国队在点球大战中意外出局。赛前,包括DeepSeek、通义千问、智谱、讯飞星火、腾讯混元等在内的12款中国主流AI大模型,几乎一致预测德国队将在常规时间获胜,比分预测集中在3:0、3:1、2:0等方向。然而,最终结果与所有AI的预测相悖,引发了对于AI在复杂现实任务中预测能力的严肃讨论。
据悉,这场预测活动由联想与咪咕联合发起,将多个国产大模型置于同一公开任务中接受检验。分析指出,AI模型倾向于依赖历史数据、球星阵容、战术体系等公开、主流的“强势叙事”进行判断,却普遍低估了将比赛拖入点球大战等“非典型”冷门路径的可能性。这暴露出现有模型在面对开放性、低样本密度问题时,可能因训练数据同源和任务目标趋同而产生“集体性偏差”。
本届世界杯中,AI的应用已远超预测层面,深度融入赛事基础设施。例如官方比赛用球内置传感器,半自动越位系统使用AI生成3D球员模型,联想提供的Football AI Pro助手能协助球队进行战术分析。预测活动将AI从“后台”技术推向“前台”,使其直接面对公众的检验与评判。
此次集体误判事件具有超越足球领域的警示意义。它模拟了在金融、公共政策等复杂现实场景中,当多个“聪明系统”基于相似逻辑形成共识时,可能共同忽略小概率但高风险的路径,进而潜藏系统性风险。行业反思认为,大模型未来需更好地量化并表达不确定性,而非追求看似确定的答案,并在错误发生后进行有效复盘,识别共识下的盲区。

粤公网安备 44010602000162号
网友评论