太平洋网络
产品库
聚超值
视频
站内导航

登录
注册
进入论坛
最近访问

加载中
论坛收藏

加载中
移动应用

首页 > 热点播报 > 正文

月之暗面：一年前验证过长思维链因成本高先搞了长文本

2025-02-17 10:38 整合编辑：科仔播报
瀵邦喕淇婃總钘夊几 QQ婵傝棄寮�閺傜増姘顔煎触 QQ缁屾椽妫�閼垫崘顔嗗顔煎触
閺€鎯版閹存劕濮涢敍锟�閸樼粯鐓￠惇瀣暪閽橈拷>>

#聚超值双11征文#扮靓我的桌面 - 雷蛇Chroma幻彩灯带套装去看看

2月17日上午消息，据悉，月之暗面研究员Flood Sung近日分享了k1.5 模型背后的完整思考过程，并透露称，2024年9月12号OpenAI o1发布带来的震撼效果，令自己陷入了Long-CoT的有效性反思中。

因为 Long-CoT 的有效性，在一年多前就被验证过。使用很小的模型训练模型做几十位的加减乘除运算，并将细粒度的运算合成为非常长的 CoT 数据进行 SFT 处理时可以获得非常好的效果。

Flood Sung表示公司意识到 Long Context 的重要性并率先把 Context 设定为较长。然而对于 Long-CoT 这件事情却没有给予足够重视主要是由于考虑到成本问题。

在这种情况下将输出设定为较长并不是最优选项。但 Flood Sung 反思道：“还有什么比 Performance（性能）更重要呢？只要 Performance 提升起来，剩下都不是主要问题。”

所以他们决心推进 Long-CoT 和 o1 研究。“我们就是要训练模型能够像我们人一样自由地思考。”Flood Sung 表示。

Flood Sung 在月之暗面Kimi官网上发表了一篇万字解密o1破解过程文章，预示着公司开始关注和对标o1并推进相关研究。

閺€鎯版 (0) +1 鐠э拷 (0) +1 闊拷 (0) +1

霸王龙补贴倒计时 10万出头入手650KM大SUV

腾讯文档AI文档助手正式接入DeepSeek R1：支持上传文档

相关阅读

月之暗面或因DeepSeek调整工作重心强化学习成关注焦点
热点播报 2025-02-15 16:55:17
腾讯文档AI文档助手正式接入DeepSeek R1：支持上传文档
2025-02-17 10:39
霸王龙补贴倒计时 10万出头入手650KM大SUV
2025-02-17 10:32
苹果地图将开始显示广告：提升服务收入
2025-02-17 10:32
DeepSeek公司高管变更新增互联网信息服务
2025-02-17 10:24

网友评论

聚超值推荐

24小时内最火资讯

精彩图赏 热点视频

热门IT产品

￥7599
苹果iPhoneX 64GB
·
￥5799
三星S9
·
￥4498
vivo NEX旗舰版
·
￥4999
OPPO Find X
·
￥1799
努比亚Z18mini
·
￥1499
OPPO A5
·
￥1999
荣耀Play（4GB RAM）
·
￥1598
vivo Y85
·
￥3499
坚果R1（6GB RAM）
·
￥3599
一加6（8GB RAM）
·

用户反馈 返回首页 相关阅读 参与讨论 回到顶部

以科技敬生活
下载太平洋科技APP