快科技12月20日消息,近日,有媒体报道,以色列特拉维夫大学的一项研究表明AI已有数字痴呆症。
在这项研究中,科学家测试了几乎所有全球顶尖AI大型语言模型, 结果都表现出类似于早期老年痴呆的认知障碍,并且版本越老,表现就越差。
为了评估实验效果,科学家使用了经常被用来测试老年痴呆症的蒙特利尔认知评估量表,针对几种公开的领先大型语言模型进行测试,包括ChatGPT的新老版本,Gemini新老版本等。设定的测试最高分为30分,26分或以上被认为是正常的。
实验结果显示,只有GPT-4o在测试中获得了最高分26分, 其次是GPT-4是25分,Gemini 1.0仅得16分。
研究还发现几乎所有模型在视觉空间能力和执行任务方面都表现不佳,无法表现出同理心或准确解释复杂的视觉场景。
科学家指出,所有大型语言模型在需要视觉抽象和执行功能的任务中都一致失败,这凸显了一个可能阻碍其在临床环境中使用的重要弱点。因此,他们做出了有数字痴呆的AI,不可能很快取代医生的这一结论。
网友评论