首页 > 热点播报 > 正文

月之暗面或因DeepSeek调整工作重心 强化学习成关注焦点

收藏成功,去查看收藏>>

据悉,月之暗面内部已将“持续拿到SOTA结果”确定为最重要的工作目标。2025年,他们计划在模型能力方向上加强多模态和长文本推理能力。然而,DeepSeek的成功让外界重新审视了月之暗面的技术和用户增长模式。两者在闭源与开源、预训练与蒸馏技术等方面存在差异。虽然尚未明确是否接入DeepSeek或开源,但有业内人士透露可能会将强化学习作为一个工作重点方向。此举被认为是对抗DeepSeek等竞争对手的一种改变或尝试。

近日OpenAI发布研究论文报告《Competitive Programming with Large Reasoning Models》,提到中国的DeepSeek-R1和Kimi k1.5利用思维链学习方法,在数学解题与编程挑战中表现出色。这也进一步引发了对于强化学习路线带来的模型能力提升的关注。

收藏 (0) +1 (0) +1 (0) +1

网友评论

网友评论
欢迎参与讨论,分享你的看法
最新评论
热门IT产品
  1. ¥7599
    苹果iPhoneX 64GB
    ·
  2. ¥5799
    三星S9
    ·
  3. ¥4498
    vivo NEX旗舰版
    ·
  4. ¥4999
    OPPO Find X
    ·
  5. ¥1799
    努比亚Z18mini
    ·
  6. ¥1499
    OPPO A5
    ·
  7. ¥1999
    荣耀Play(4GB RAM)
    ·
  8. ¥1598
    vivo Y85
    ·
  9. ¥3499
    坚果R1(6GB RAM)
    ·
  10. ¥3599
    一加6(8GB RAM)
    ·
以科技敬生活
下载太平洋科技APP