首页 > 热点播报 > 正文

OpenAI新o3模型基准测试表现出色 普及仍需解决高昂成本问题

闂佽 鍋撻柟顖滃椤ユ垿鏌熺€涙ê濮囧┑顔界洴閺佸秹鏁撻敓锟�闂佸憡岣跨划顖炴偂閿熺姵鍎戦悗锝庡亝閺嗩亪鏌﹀鍫熷>>

【太平洋科技快讯】近日,OpenAI发布了最新模型o3,这是继o1系列模型之后的又一力作。o3模型在多个关键领域取得了新的突破,尤其是在推理、编程和数学问题解决方面。

VCG41N1849995861

o3模型在ARC-AGI基准测试中表现出色,成为首个突破该基准的AI模型。在高计算设置下,o3模型取得了87.5%的优异成绩,而在低计算设置下也有75.7%的表现,是o1模型性能的三倍。此外,在EpochAI的Frontier Math基准测试中,o3解决了25.2%的问题,远超其他模型。

尽管o3模型在性能上取得了显著成果,但其高昂的计算成本成为了广泛关注的焦点。据ARC-AGI基准测试的创建者透露,o3模型每项任务在高计算模式下的成本高达数千美元,而o1模型每个任务的成本仅为5美元,o1-mini更是只需几美分。这意味着o3模型在取得高分的同时,消耗了170多倍的计算资源。

鉴于其高昂的成本,o3模型在实际应用中可能难以普及。目前,它更适合用于处理复杂问题,如长期战略决策等。对于日常小问题的解决,o3模型可能并不适用。

为了使o3模型更具实用性,未来可能需要寻求在AI推理芯片和成本效益方面的技术突破。更高效的AI推理芯片和更具成本效益的解决方案,有望降低o3模型的使用成本,从而推动其在更多领域的应用。

闂佽 鍋撻柟顖滃椤ワ拷 (0) +1 闁荤姍宥嗗 (0) +1 闂傚⿴浜烽幏锟� (0) +1

网友评论

热门IT产品
  1. ¥7599
    苹果iPhoneX 64GB
    ·
  2. ¥5799
    三星S9
    ·
  3. ¥4498
    vivo NEX旗舰版
    ·
  4. ¥4999
    OPPO Find X
    ·
  5. ¥1799
    努比亚Z18mini
    ·
  6. ¥1499
    OPPO A5
    ·
  7. ¥1999
    荣耀Play(4GB RAM)
    ·
  8. ¥1598
    vivo Y85
    ·
  9. ¥3499
    坚果R1(6GB RAM)
    ·
  10. ¥3599
    一加6(8GB RAM)
    ·
用户反馈 返回首页 相关阅读 参与讨论 回到顶部
以科技敬生活
下载太平洋科技APP