請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

電獺少女

更新於 2025年05月05日03:46 • 發布於 2025年05月02日08:09 • 嘻嘻

MiMo 這名字好可愛

除了 ChatGPT、DeepSeek,現在又有一款新模型問世!小米集團 30 日宣布第一個專為推理而生的大模型「Xiaomi MiMo」,為百家爭鳴的 AI 競爭投下一個震撼彈

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

Xiaomi MiMo 厲害在哪?小米集團聲稱此模型只憑藉 7 B 的參數規模,就超越 OpenAI 的閉源推理模型 o1mini 以及阿里 Qwen 更大規模的開源推理模型 QwQ-32B-Preview,其強大的推理能力,是由於預訓練和後訓練階段的多層面創新驅動

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

在預訓練過程中,模型已見過許多推理模式,又分為數據和訓練。在數據方面,模型藉由挖掘大量的推理語料,合成出約 200 Btokens 的推理數據,更進行三階段訓練,逐步增加訓練難度,總訓練已達 25T 的 tokens

至於後訓練方面,重點是讓強化學習(RL)的表現更穩定、更有效率,又分成兩部分:演算法和系統架構

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

在演算法方面,小米設計出新方法「Test Difficulty Driven Reward」,專門解決在比較困難的情況下,強化學習容易遇到獎勵太少、學不起來的問題;另外也加入「Easy Data Re-Sampling」策略,讓訓練過程更平穩

至於系統架構,小米打造一套訓練流程「Seamless Rollout」,提升整體 RL 訓練速度到 2.29 倍,驗證速度也快了 1.96 倍,大幅提升效率

(圖片來源:科技網)

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

相信大家一定很疑惑,跟備受大眾喜愛的 ChatGPT 相比,有什麼不同呢?ChatGPT 由 OpenAI 開發,屬於大型通用語言模型,具備突出的語言理解與生成能力,而 Xiaomi MiMo 由小米集團自己研發,可預測的是,其將會成為專門替小米生態系統優化的 AI 助手,功能設計更偏重生活實用與裝置控制

(圖片來源:Shutterstock)

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

值得注意的是,MiMo-7B 全系列模型均已開源,推出日期甚至在阿里巴巴發佈新一代通義千問模型 Qwen3 的隔日,AI 競爭火藥味真的是隔著屏幕也聞的到。接下來就期待各家模型的實測比較了!

電獺少女 Instagram 精選每日科技新聞和促咪事件,還有各類 App 的密技心得,就差你沒追蹤!

查看原始文章

更多理財相關文章

01

知名科技廠工會爆大動作 預告這天舉行

三立新聞網
02

川普:最高法院關稅裁決令人失望 將徵10%全球關稅

中央通訊社
03

當年聽到英特爾要立正 如今被打趴 台灣半導體大老:台積電10年內沒對手

鏡報
04

改名戰逆局3/一家燒臘店年收可破億 少東車禍亡 媳婦自殺全變調

鏡週刊
05

快訊/川普強勢放話了!美股開盤4大指數全跌

三立新聞網
06

新北天花板! 中和預售飆單坪130萬 網驚:何不買台北?

民視新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...