清华大学教授、智谱创始人唐杰在AGI-Next前沿峰会上表示,2025年以来AI大模型在人类终极测试(HLE)这一高难度智能评测基准中的表现开始快速提升。
据悉,2020年AI大模型仅能解决基础问题,2021-2022年具备数学推理能力,2023-2024年升级至复杂推理能力。2025年模型在包含极端冷门问题的人类终极测试中能力显著提升。
唐杰指出,虽然AI的泛化能力仍需提高,但行业正通过多种手段进行改进。2020年通过扩大数据量与算力强化知识记忆,2022年通过指令微调与强化学习提升推理能力,2025年尝试让机器自主探索以强化泛化能力。

粤公网安备 44010602000162号
网友评论