首页 > 热点播报 > 正文

月之暗面:一年前验证过长思维链 因成本高先搞了长文本

閺€鎯版閹存劕濮涢敍锟�閸樼粯鐓¢惇瀣暪閽橈拷>>

2月17日上午消息,据悉,月之暗面研究员Flood Sung近日分享了k1.5 模型背后的完整思考过程,并透露称,2024年9月12号OpenAI o1发布带来的震撼效果,令自己陷入了Long-CoT的有效性反思中。

因为 Long-CoT 的有效性,在一年多前就被验证过。使用很小的模型训练模型做几十位的加减乘除运算,并将细粒度的运算合成为非常长的 CoT 数据进行 SFT 处理时可以获得非常好的效果。

Flood Sung表示公司意识到 Long Context 的重要性并率先把 Context 设定为较长。然而对于 Long-CoT 这件事情却没有给予足够重视主要是由于考虑到成本问题。

在这种情况下将输出设定为较长并不是最优选项。但 Flood Sung 反思道:“还有什么比 Performance(性能)更重要呢?只要 Performance 提升起来,剩下都不是主要问题。”

所以他们决心推进 Long-CoT 和 o1 研究。“我们就是要训练模型能够像我们人一样自由地思考。”Flood Sung 表示。

Flood Sung 在月之暗面Kimi官网上发表了一篇万字解密o1破解过程文章,预示着公司开始关注和对标o1并推进相关研究。

閺€鎯版 (0) +1 鐠э拷 (0) +1 闊拷 (0) +1

网友评论

热门IT产品
  1. ¥7599
    苹果iPhoneX 64GB
    ·
  2. ¥5799
    三星S9
    ·
  3. ¥4498
    vivo NEX旗舰版
    ·
  4. ¥4999
    OPPO Find X
    ·
  5. ¥1799
    努比亚Z18mini
    ·
  6. ¥1499
    OPPO A5
    ·
  7. ¥1999
    荣耀Play(4GB RAM)
    ·
  8. ¥1598
    vivo Y85
    ·
  9. ¥3499
    坚果R1(6GB RAM)
    ·
  10. ¥3599
    一加6(8GB RAM)
    ·
以科技敬生活
下载太平洋科技APP