据悉,阿里巴巴于3月6日凌晨发布并开源了全新的推理模型通义千问QwQ-32B。该模型通过大规模强化学习,在数学、代码及通用能力上实现了质的飞跃,整体性能比肩DeepSeek-R1。同时,它还成功降低了部署使用成本,并可在消费级显卡上进行本地部署。目前,阿里已将该模型向全球开源,并允许免费下载及商用。这是阿里探索推理模型领域的最新成果,经过冷启动基础和两轮大规模强化学习后,在32B的模型尺寸上取得了令人惊喜的推理能力提升。
据悉,阿里巴巴于3月6日凌晨发布并开源了全新的推理模型通义千问QwQ-32B。该模型通过大规模强化学习,在数学、代码及通用能力上实现了质的飞跃,整体性能比肩DeepSeek-R1。同时,它还成功降低了部署使用成本,并可在消费级显卡上进行本地部署。目前,阿里已将该模型向全球开源,并允许免费下载及商用。这是阿里探索推理模型领域的最新成果,经过冷启动基础和两轮大规模强化学习后,在32B的模型尺寸上取得了令人惊喜的推理能力提升。
热点播报 2025-03-04 15:28:48
热点播报 2025-02-25 17:29:32
热点播报 2025-02-24 11:32:40
热点播报 2025-02-24 09:46:10
热点播报 2025-02-20 19:16:23
网友评论