首页 > 热点播报 > 正文

面壁智能联创谈DeepSeek出圈:与OpenAI o1不开源有关 R1模型创造了新的ChatGPT时刻

据悉,近日面壁智能联合创始人兼首席科学家刘知远指出,DeepSeek发布的R1模型成功复现了OpenAI o1的深度推理能力,并通过开源方式分享了实现细节。该模型训练流程中的两个亮点是规则驱动方法实现大规模强化学习以及混合微调数据实现推理能力跨任务泛化。此外,基于DeepSeek V3基座模型经过大规模强化学习得到了纯粹通过强化学习增强的强推理模型DeepSeek-R1-Zero,并且将其应用于其他领域展示出泛化能力。这一成果对比OpenAI o1选择不开源并采用高收费方式进行限制,在全球范围内让更多人感受到深度思考所带来的震撼。

网友评论

热门IT产品
  1. ¥7599
    苹果iPhoneX 64GB
    ·
  2. ¥5799
    三星S9
    ·
  3. ¥4498
    vivo NEX旗舰版
    ·
  4. ¥4999
    OPPO Find X
    ·
  5. ¥1799
    努比亚Z18mini
    ·
  6. ¥1499
    OPPO A5
    ·
  7. ¥1999
    荣耀Play(4GB RAM)
    ·
  8. ¥1598
    vivo Y85
    ·
  9. ¥3499
    坚果R1(6GB RAM)
    ·
  10. ¥3599
    一加6(8GB RAM)
    ·