北京时间6月13日,2024阿里巴巴全球数学竞赛(简称“阿里数赛”)公布决赛名单,801人成功晋级,AI队伍未能达到决赛入围分数线,无缘最终角逐。
今年阿里数赛首创AI挑战赛,吸引了来自全球知名高校院所与企业的563支队伍报名,其中00后占比超50%。他们各显神通,使用模型调优、AI Agent、提示词工程等多种方式,试图推动AI构建更强大的数学能力。统计显示,参赛AI队伍的平均分已达到了人类选手平均水平,但离数学高手仍有较大差距。AI最高分仅为34分,无缘决赛。AI挑战赛前三名分别为来自上海建平中学的涂津豪、西南交通大学的特工宇宙团队、中国人民大学的SuperCarryMan团队。
据介绍,AI成绩不佳,核心还是由于基础模型的数学能力有限。虽然在面对解答题和证明题时,AI可以通过知识检索等方式拿到基础分,但一旦涉及到后续的深入分析,AI就开始出现“知识幻觉”。尤其是在面临选择题时,多数AI出现了“蒙题”的现象。不过,也有案例显示,提示词工程确实能够在一定幅度内提升AI的数学潜能,有选手请AI扮演一名数学竞赛大师,并许诺“想出更好回答奖励30万美元”,经比对验证,该方法可提高20%的得分率。阿里数赛组委会成员、达摩院决策智能实验室负责人印卧涛表示,“数学是人类智慧的皇冠,AI挑战赛是一项积极的尝试,有助于我们持续突破AI的能力上限,带来更多可能。”
公告显示,今年共有801名人类选手挺进决赛,遍布全球17个国家与地区,平均年龄22岁,主要来自北大、清华、麻省理工、剑桥等知名高校。江苏省涟水中等专业学校的17岁女生姜萍表现亮眼,从一众名校生中突围,拿到了93分的好成绩,全球排名12,是阿里数赛举办以来首位打进决赛的中专在读生。她专业是服装设计,对数学却十分着迷,花了两年自学偏微分方程,预选赛的两天里除了吃饭、睡觉都在答题,只为证明“女生学数学也可以挺棒的”。
网友评论