機器人領域的 LLaMA 時刻:阿里巴巴推 RynnBrain 開源模型,要正面迎戰 Google 與 NVIDIA
當大型語言模型(LLM)逐漸成熟,科技巨頭的競爭焦點逐漸轉向能與真實世界互動的「實體 AI(Physical AI)」。像是近日阿里巴巴宣布推出全新開源機器人 AI 模型「RynnBrain」,試圖為機器人打造可理解與操作物理世界的「大腦」,同時展現中國科技巨頭加速在全球具身智慧(Embodied Intelligence)市場卡位的決心。
這款由阿里巴巴達摩院(DAMO Academy)發布的 RynnBrain,被定位為機器人領域的基礎模型,核心目標是讓機器人能理解周遭物理環境並識別物體。在官方展示中,搭載 RynnBrain 的機器人能辨識不同水果,並將這些水果精準放入籃中。這樣的操作看似簡單,實際上卻涉及對物體特徵的判斷、空間位置的計算,以及精細的運動控制協調,顯示 RynnBrain 正在將語言模型時代的能力,延伸到可實際執行動作的實體場景中。
RynnBrain 採用端到端整合設計,讓感知、規劃與控制由同一個大腦處理
從技術架構來看,RynnBrain 是一個典型的「視覺–語言–行動(VLA)」模型,其最大突破在於採用端到端(End-to-End)的整合設計,不再像傳統機器人系統將感知、規劃與控制視為分離的模組,而是統一由一個大腦處理。
這樣的設計模式,也代表 RynnBrain 能直接解讀視覺輸入與自然語言指令,並轉化為機器人的具體物理行動。例如,機器人可以接收「拿起紅色杯子並放在架子上」的口語指令,接著在無需人工編寫特定規則的情況下,自行在雜亂環境中識別物體、規劃無碰撞路徑並進行抓取。
相關技術文件指出,RynnBrain 使用 Transformer 結構,並基於阿里巴巴的 Qwen3-VL 視覺語言模型進行訓練。其架構包含處理鏡頭影像的 Vision Transformer (ViT)、解讀指令的語言解碼器,以及一個關鍵的基於擴散模型(Diffusion-based)的 Action Head,讓機器人能進行物體映射、軌跡預測和環境導航,並在動態環境中生成更平滑的運動路徑。
此外,在訓練過程中,RynnBrain 結合大規模的模擬環境數據與真實世界的遙控操作數據,讓模型具備理解空間與時間關係的能力。在基準測試中,阿里巴巴稱 RynnBrain 的效能已超越 Google 的 Gemini Robotics-ER 1.5 與 NVIDIA 的 Cosmos 模型。
在全球實體 AI 競賽中,阿里巴巴的主要對手 Google DeepMind 已推出 Gemini Robotics-ER 1.5,試圖將語言模型能力延伸至實體操作;NVIDIA 則以 Cosmos 平台結合 Isaac 機器人工具包,從算力到開發框架建立完整生態系;Tesla 的 Optimus 人形機器人也持續進化,強化軟硬整合能力。這也代表,目前機器人 AI 的競爭早已不只是模型性能之爭,而是平台、生態與產業落地速度的全面較量。
創造「機器人領域的 LLaMA 時刻」,RynnBrain 試圖發展成實體 AI 界的 Android 系統
這次阿里巴巴選擇將 RynnBrain 以開源方式釋出,這一策略也被外界視為「機器人領域的 LLaMA 時刻」,意即類似 Meta 當初釋出語言模型的做法。阿里巴巴試圖透過免費提供強大的基礎模型,吸引全球機器人新創、大學實驗室甚至硬體競爭對手採用,從而建立龐大的開發者生態系。在此之前,物理 AI 的開源主要侷限於史丹佛或柏克萊等學術機構,因此阿里巴巴此舉,更標誌著科技巨頭首次大規模將商業級機器人模型投入開源社群的里程碑。
另一方面,在美中科技戰與晶片出口管制加劇的背景下,開源模式成為 RynnBrain 突破地理圍堵的利器,因為一旦模型權重(Model Weights)被釋出,便難以被出口禁令完全封鎖。這也讓中國的 AI 技術能成為東南亞、中東及拉丁美洲等新興市場開發者的重要選項,特別是對於那些缺乏資源購買昂貴西方專有系統的開發者而言,RynnBrain 提供了極具吸引力的替代方案。
透過這種「農村包圍城市」般的擴散策略,RynnBrain 有望挑戰 Google 與 NVIDIA 的封閉生態,成為實體 AI 領域的共同標準,甚至試圖發展成「實體 AI 界的 Android 系統」。
因此,這次阿里巴巴的行動,不僅是技術分享,更是一場關於誰能定義未來智慧機器「底層軟體架構」的博弈,若能成功讓全球產業依賴其開源標準,將有助於弱化西方科技巨頭的壟斷優勢,並確立中國在下一代自動化浪潮中的話語權。
RynnBrain 將成為阿里巴巴內部商業版圖的關鍵支撐
未來,RynnBrain 不只是向外擴散,在阿里巴巴集團內部,也將成為核心商業版圖的重要支撐。例如,阿里巴巴旗下菜鳥網絡(Cainiao)已擁有高度自動化的全球倉儲系統,因此像 RynnBrain 如此強大的「機器人大腦」,將有望提升物流效率並壓低營運成本。同時,隨著開源模型被廣泛採用,企業與開發者勢必仰賴雲端算力進行訓練、微調與部署,這也將帶動阿里雲(Alibaba Cloud)的使用量與營收增長,形成「開源推動雲端、雲端強化生態」的飛輪效應,進一步鞏固其在雲端運算與企業服務市場的戰略位置。
RynnBrain 的意義不僅在於技術突破,更在於它試圖以開源模式重寫機器人 AI 的競爭規則。當實體 AI 成為下一波產業核心,誰能掌握「機器人大腦」的標準與生態,誰就更有機會主導智慧製造與自動化的未來版圖。
*本文開放合作夥伴轉載,資料來源:《Web Pro News》、《Bloomberg》、《CNBC》、《BLOCKONOMI》,首圖來源:Unsplash