請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

電獺少女

更新於 2025年05月05日03:46 • 發布於 2025年05月02日08:09 • 嘻嘻

MiMo 這名字好可愛

除了 ChatGPT、DeepSeek,現在又有一款新模型問世!小米集團 30 日宣布第一個專為推理而生的大模型「Xiaomi MiMo」,為百家爭鳴的 AI 競爭投下一個震撼彈

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

Xiaomi MiMo 厲害在哪?小米集團聲稱此模型只憑藉 7 B 的參數規模,就超越 OpenAI 的閉源推理模型 o1mini 以及阿里 Qwen 更大規模的開源推理模型 QwQ-32B-Preview,其強大的推理能力,是由於預訓練和後訓練階段的多層面創新驅動

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

在預訓練過程中,模型已見過許多推理模式,又分為數據和訓練。在數據方面,模型藉由挖掘大量的推理語料,合成出約 200 Btokens 的推理數據,更進行三階段訓練,逐步增加訓練難度,總訓練已達 25T 的 tokens

至於後訓練方面,重點是讓強化學習(RL)的表現更穩定、更有效率,又分成兩部分:演算法和系統架構

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

在演算法方面,小米設計出新方法「Test Difficulty Driven Reward」,專門解決在比較困難的情況下,強化學習容易遇到獎勵太少、學不起來的問題;另外也加入「Easy Data Re-Sampling」策略,讓訓練過程更平穩

至於系統架構,小米打造一套訓練流程「Seamless Rollout」,提升整體 RL 訓練速度到 2.29 倍,驗證速度也快了 1.96 倍,大幅提升效率

(圖片來源:科技網)

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

相信大家一定很疑惑,跟備受大眾喜愛的 ChatGPT 相比,有什麼不同呢?ChatGPT 由 OpenAI 開發,屬於大型通用語言模型,具備突出的語言理解與生成能力,而 Xiaomi MiMo 由小米集團自己研發,可預測的是,其將會成為專門替小米生態系統優化的 AI 助手,功能設計更偏重生活實用與裝置控制

(圖片來源:Shutterstock)

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

值得注意的是,MiMo-7B 全系列模型均已開源,推出日期甚至在阿里巴巴發佈新一代通義千問模型 Qwen3 的隔日,AI 競爭火藥味真的是隔著屏幕也聞的到。接下來就期待各家模型的實測比較了!

電獺少女 Instagram 精選每日科技新聞和促咪事件,還有各類 App 的密技心得,就差你沒追蹤!

查看原始文章

更多理財相關文章

01

台灣關稅15%!政院曝「雙向投資機制」:美將擴大投資「五大信賴產業」

民視新聞網
02

廣達尾牙登場!林百里:未來3年是AI爆發期

NOWNEWS今日新聞
03

行政院宣布台灣對等關稅15%不疊加簽署MOU! 還獲232最惠國待遇

新頭殼
04

台積電帶飛!台股明開盤有望「跳空500點」 投信副總:股市現在只剩這弱點

風傳媒
05

13家金控2025年獲利成績出爐!3金控最會賺、全年最飆的金控竟是「它們」

商周財富網
06

中砂、昇陽、新應材...2奈米不是只有台積電會賺!「5檔材料商」搭上成長列車

商周財富網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...