DeepSeek于知乎开设官方账号,独家发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。
文章中指出,DeepSeek-V3 / R1 推理系统的优化目标是更大的吞吐和更低的延迟。为实现这两个目标,DeepSeek采用了大规模跨节点专家并行(EP)方案,并详细介绍了如何使用EP增加批量大小、减少传输耗时以及进行负载均衡。
此外,该文章还揭示了DeepSeek的成本和利润率等关键信息。根据假定GPU租赁成本为2美元/小时计算,在一天内总收入为562,027美元的情况下,其成本利润率达到545%。
网友评论