深度求索(Deep Seek)通过算法优化取得了模型效能和硬体效能之间的平衡点,并开源了两款基于V3模型的推理模型——DeepSeek-R1。该模型在人工智能领域引起轰动,凸显软件优化方向。V3模型依托MLA技术和MoE架构,在实际运行中不仅成功减少了GPU使用量,还保持高效能表现。这一突破性创新对其他厂商产生冲击,并将推动AI Agent应用发展。
据悉,中国新创AI厂商深度求索(Deep Seek)自2023年7月成立以来陆续发布多款大型语言模型,并备受关注。其基于算法创新、训练成本等优势脱颖而出,成为AI领域的重要力量之一。随着推理模型效能提升,Agentic AI代理将逐渐成熟并广泛应用。
网友评论