【太平洋科技快讯】小米宣布旗下MiMo-V2.5 系列大模型API于北京时间5月27日0:00正式生效,全球同步调整。相比原始API定价,新定价最高降幅达99%,并取消上下文窗口长度区分。
本次调价覆盖MiMo-V2.5与MiMo-V2.5 Pro两个版本:
输入缓存命中价:
MiMo-V2.5 Pro降至0.025元/百万tokens
MiMo-V2.5降至0.02元/百万tokens
输出价格:
MiMo-V2.5 Pro降至6元/百万tokens
MiMo-V2.5降至2元/百万tokens
同时,小米优化Token Plan计费体系,实现加量不加价,用量提升至原标准的5–8倍,并引入Credits机制简化计费规则。
小米表示,降价依托推理系统深度优化:通过SGLang HiCache与SWA机制,将KV Cache数据搬运量降至原水平的1/7,可缓存token数量提升近5倍;结合专家并行与输入长度分桶策略,提升集群吞吐能力,降低单位token服务成本。


粤公网安备 44010602000162号
网友评论