小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度
|
快科技5月27日消息,今日,小米宣布,旗下MiMo-V2.5系列大模型API迎来永久降价。 据介绍,相比原始API定价,MiMo-V2.5系列新价格最高降幅可达99%,并且不再区分上下文窗口长度。 本次调价已于北京时间5月27日0:00正式生效,全球同步调整。 具体来看,此次降价覆盖MiMo-V2.5和MiMo-V2.5 Pro两个版本。 其中,MiMo-V2.5 Pro输入缓存命中价格降至0.025元/百万tokens,最高降幅达99%;MiMo-V2.5输入缓存命中价格降至0.02元/百万tokens,最高降幅达98%。 输出价格方面,MiMo-V2.5 Pro降至6元/百万tokens,最高降幅86%;MiMo-V2.5降至2元/百万tokens,最高降幅93%。 除了API价格下调外,MiMo的Token Plan计费体系也同步迎来重大优化。 优化后的Token Plan在加量不加价的基础上,用量提升至原来的5至8倍,同时引入Credits概念,让计费规则更清晰、更易理解。 小米称,本次价格调整背后,离不开技术团队在推理系统上的持续优化。 据了解,小米基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7,并将可缓存token数量提升至优化前的近5倍,从而显著提升缓存命中率和推理效率。 同时,小米还通过优化专家并行方案、输入长度分桶策略等方式,进一步提升集群输入吞吐能力,在保障服务质量的前提下,持续降低单位token服务成本。 |
在线投稿
-
相关阅读
-
减肥的女儿被妈妈做的减脂餐震撼到了:画风硬核
-
黄圣依直播带货前夫狂刷十几万成榜一大哥 助播直言:追妻火葬场没用
-
五星级酒店推12888元自助餐年卡引热议 网友:能吃回本吗
-
卢伟冰明确:小米汽车2027年三四季度启动出海!
-
小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度
-
异性的吸引力!男子高速上疯狂逆行:“我想早点见到她”
-
百万粉丝女网红捐款1047万引热议 网红方回应:两位粉丝出1千万 个人仅捐47万
-
摩托车驾驶员突遭蛇攻击:疑为眼镜蛇 春夏是蛇类活跃期
-
精彩图片
-
严重污染!印度首都河面漂浮大量有毒泡沫
-
金饰价格突破800元/克大关
-
绝美!北京朝霞遇到平流雾
-
美国给以色列派先遣队,援助的“萨德”也将启用?
-
以总理住宅遭无人机袭击 以方反应强烈
-
美政府紧急调查以色列报复伊朗计划外泄事件
-
以军袭击加沙地带北部拜特拉希亚地区已致73人死亡
-
加沙民众:每时每刻都有屠杀发生 我们已是活死人
-
新帖速递
-
减肥的女儿被妈妈做的减脂餐震撼到了:画风硬核
-
黄圣依直播带货前夫狂刷十几万成榜一大哥 助播直言:追妻火葬场没用
-
五星级酒店推12888元自助餐年卡引热议 网友:能吃回本吗
-
卢伟冰明确:小米汽车2027年三四季度启动出海!
-
小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度
-
异性的吸引力!男子高速上疯狂逆行:“我想早点见到她”
-
百万粉丝女网红捐款1047万引热议 网红方回应:两位粉丝出1千万 个人仅捐47万
-
摩托车驾驶员突遭蛇攻击:疑为眼镜蛇 春夏是蛇类活跃期

精彩评论文明上网理性发言,请遵守评论服务协议
共0条评论