据悉,摩尔线程智能科技(北京)有限责任公司宣布通过DeepSeek提供的蒸馏模型,在国产GPU上实现了高性能推理。该模型可以将大规模模型的能力迁移至低功耗版本,并且用户还可以使用MTT S80和MTT S4000进行DeepSeek-R1蒸馏模型的部署。此前已有用户在MTT S80上手动完成了相关实践。
据悉,摩尔线程智能科技(北京)有限责任公司宣布通过DeepSeek提供的蒸馏模型,在国产GPU上实现了高性能推理。该模型可以将大规模模型的能力迁移至低功耗版本,并且用户还可以使用MTT S80和MTT S4000进行DeepSeek-R1蒸馏模型的部署。此前已有用户在MTT S80上手动完成了相关实践。
热点播报 2025-02-04 13:08:34
热点播报 2025-02-04 11:24:50
热点播报 2025-02-03 10:48:43
热点播报 2025-02-02 06:48:38
热点播报 2025-01-17 16:56:02
网友评论