時間在變,空間随着時間也在變,不變的唯有真知灼見。
2026年05月30日  星期六
首頁
财經
觀察
參考
ESG
公告
市場
研究
IPO
公司
周報
動态
推薦
首頁 > 快訊

【小米MiMo首次公開模型推理系統全鍊路優化技術細節】

來源:澤依 時間:2026-05-30 19:21:10

字号
【小米MiMo首次公開模型推理系統全鍊路優化技術細節】5月30日,小米正式公開MiMo-V2.5系列模型的推理系統全鍊路優化方案。據小米方面介紹,團隊圍繞Hybrid SWA+MoE+多模态的複合架構,系統性重構了從KVCache管理、分級緩存、前綴緩存到調度策略與Prefill/Decode鍊路的完整推理棧,KVCache存儲壓縮至同級方案的約1/7,在長序列場景下推理成本大幅下降——這是本次降價的核心技術基礎。5月27日,MiMo-V2.5系列API完成永久降價,最高降幅達99%,不區分輸入長度。
微信掃碼 > 右上角點擊 > 分享