小米新模型 比DeepSeek便宜又快

小米17日發表其自行研發的開源AI模型。圖/美聯社

小米17日發表其自行研發的開源AI模型MiMo-V2-Flash。該模型負責人、在大陸有「AI天才少女」之稱的羅福莉指出,在推理價格和推理速度方面,該模型都比DeepSeek-V3.2表現更好。小米總裁盧偉冰指出,小米將加大研發投入,未來5年將投資人民幣(下同)2,000億元。

綜合陸媒報導,羅福莉是「95後」AI研究者,碩士期間曾在國際頂級會議ACL(國際計算語言學協會)上發表多篇論文,畢業後加入阿里巴巴達摩院,主導開發出多語言預訓練模型VECO。之後,她轉戰DeepSeek,是DeepSeek-V2的關鍵開發者之一。到了去年底,傳出她被小米以千萬年薪挖角,擔任小米AI實驗室的大模型團隊負責人。

小米集團17日舉行「人車家全生態合作伙伴大會」,羅福莉以小米MiMo大模型負責人亮相。她表示,儘管MiMo-V2-Flash總參數和活躍參數不多,但其代碼能力和代理(Agent)能力在世界級公開公正評估榜單上,已進入全球開源模型Top1~2行列。

羅福莉進一步表示,該模型大部分評估基準已超過或與DeepSeek-V3、阿里巴巴通義千問等模型相當。在推理價格和速度方面,比DeepSeek-V3.2更便宜一點,但推理速度大概快三倍。

再與Google的Gemini 2.5 Pro相比,雖然綜合性能相當,且推理速度差不多,但Gemini 2.5 Pro的推理成本比MiMo-V2-Flash貴整整20倍。