据悉,中国创新型科技公司DeepSeek成立于2023年7月17日,专注于开发先进的大语言模型(LLM)和相关技术。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,并在风格控制类模型分类中与OpenAI的o1模型并列第一。与其他闭源巨头不同,DeepSeek采用开源模式,并公布了相关论文,确保知识免费提供给全世界。其最新发布的模型DeepSeek-R1在后训练阶段使用了强化学习技术,在仅有极少标注数据的情况下显著提升了推理能力,在数学、代码、自然语言推理等任务上性能表现出色。这一消息引起了科技界和投资界广泛关注。
网友评论