Physical Address

304 North Cardinal St.
Dorchester Center, MA 02124

小米開源MiMo-7B,7B參數超OpenAI o1-mini與阿里Qwen-32B,AIME與LiveCodeBench表現亮眼,強化學習與預訓練創新推動推理能力

小米首推MiMo-7B開源!推理能力勝OpenAI與阿里

TMN 科技編輯部報導

MiMo-7B推理能力超群

2025年4月30日,小米宣布開源首個推理大模型MiMo-7B,專為數學與程式碼推理設計(MiMo Technical Report)。僅7B參數的MiMo-7B,在AIME 24-25數學推理(得分69.8)與LiveCodeBench v5程式碼競賽(得分60.6)中,超越OpenAI閉源o1-mini與阿里Qwen-32B-Preview,表現媲美DeepSeek-R1(HuggingFace Xiaomi MiMo)。小米大模型Core團隊表示,MiMo透過預訓練與強化學習(RL)創新,顯著提升推理能力。

預訓練與強化學習突破

MiMo-7B預訓練採用三階段策略,挖掘200B推理語料,總計25T tokens,逐步提升難度(MiMo Technical Report)。後訓練引入「Test Difficulty Driven Reward」緩解獎勵稀疏,結合「Easy Data Re-Sampling」穩定RL,訓練與驗證速度分別加速2.29倍與1.96倍。相較DeepSeek-R1-Distill-7B與Qwen2.5-32B,MiMo-7B在相同RL數據下,數學與程式碼推理表現更優(HuggingFace Xiaomi MiMo)。

開源與市場影響

MiMo-7B全系列(Base、SFT、RL、RL-Zero)已上架HuggingFace,開放下載(HuggingFace Xiaomi MiMo)。彭博社報導,小米開源策略強化其AI市場競爭力,股價當日上漲5.16%(Bloomberg Trade)。DeepSeek-R1掀起的RL共創浪潮中,MiMo-7B以高效參數脫穎而出,挑戰OpenAI與阿里主導的推理模型格局。

TMN 編輯部解析

MiMo-7B以7B參數超越32B模型,凸顯開源AI的潛力。小米技術報告顯示,其RL演算法與200B推理語料顯著提升數學與程式碼能力(MiMo Technical Report)。彭博社分析,開源趨勢將加速AI民主化,2025年全球推理模型市場預計成長15%(Bloomberg Trade)。歐洲AI初創(如Mistral)亦推7B級模型,顯示小型高效模型趨勢。投資者應關注小米後續AGI計畫與全球開源生態,評估推理模型對產業的長期影響。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *