Physical AI 進入「手部操作」決勝點:Genesis AI 推 GENE-26.5 模型與仿人機械手,突破機器人落地瓶頸
長久以來,要讓機器人精準抓取、移動、拆解或組裝物體,遠比教它們走路或說話困難得多,這也是人形機器人一直無法在現實世界大規模落地的關鍵門檻。然而,法國機器人新創 Genesis AI 正在逐步打破這道技術門檻。
Genesis AI 近日正式發表專為機器人打造的基礎 AI 模型 GENE-26.5,並同步推出一隻高度接近人類靈巧度的實體機械手,目標是賦予機器人前所未有的適應力,讓機器人跨入「會動手做事」的新階段。
會煮飯、打蛋、彈鋼琴,Genesis AI 用 Demo 展示人類級靈巧操作
為了具體展現 GENE-26.5 的實力,Genesis AI 釋出一系列令人驚豔的自主執行影片,全程以原速呈現且無人類遠端操控。在展示影片中,機器人能流暢完成高達 20 個步驟的料理任務,包含切番茄、單手打蛋,甚至能雙手製作冰沙並完成遞送,或是單手抓取並分類四個不同大小的物體,以及在空中連續操作解開魔術方塊。此外,機器人還能彈奏約 130 BPM 的快節奏鋼琴樂曲,並進行複雜的線束整理。
不過,這些任務並非「零樣本學習(zero-shot)」,機器人仍需針對特定任務進行事前訓練。Genesis AI 執行長 Zhou Xian 解釋,以料理 Demo 為例,需要數百條操作軌跡來訓練機器人打蛋或切番茄,一項 30 秒的複雜技能,背後大約需要數小時的人類示範資料,加上不到半小時的機器人執行資料。
在成功率方面,多數料理步驟已能達到 90% 至 95% 的成果,儘管難度極高的「單手打蛋」與「用刀轉移番茄」在拍攝時成功率約為 50% 至 60%,Zhou Xian 仍自豪地表示:「這可能是機器人有史以來,以最貼近人類的方式、效率與速度所執行的最複雜任務。」他也透露,目前機器人約已達到人類操作速度的 60% 至 70%,雖然操作問題尚未被徹底解決,但已邁出關鍵一步。
突破操作瓶頸,打造從模型到硬體的全棧式路線
為什麼 Genesis AI 能達成這項成果?關鍵就在於他們決定走全棧式(full-stack)路線。最初,公司的目標只是打造更好的機器人模型,但團隊很快意識到,機器人長期受限於「體現差距(embodiment gap)」,意即人類手部與傳統機器爪的形狀差異過大,導致機器人很難直接從人類的真實資料中學習。
為了解決這個硬傷,Genesis AI 不僅開發 AI 模型與模擬器,更親自打造一雙具有 20 個自由度與 20 顆馬達的「仿人機械手」。與傳統透過前臂馬達和肌腱線纜驅動的設計不同,這雙仿人機械手的馬達直接配置在手部,大小與形狀也極度接近人手,大幅縮小與真實世界條件的差距。
同時,Genesis AI 還推出配備觸覺感測電子皮膚的「資料訓練手套」,能建立手套、人手與機器手之間「1:1:1」的對應關係。因此,透過結合網路資料,以及訓練手套蒐集來的人類手部動作與觸覺、力覺訊號,Genesis AI 得以建立龐大的資料引擎。此外,團隊也開發具備超寫實物理運算的模擬系統,透過縮小模擬與現實的差距,讓 AI 模型的訓練與改善比傳統實體測試更快速。
從展示走向產業:優先鎖定汽車、電子、製藥與物流場景
在擁有強大軟硬體整合能力後,Genesis AI 正積極將 GENE-26.5 推向產業應用,並與法國、德國、義大利的潛在客戶進入進階洽談。Genesis AI 總裁 Theophile Gervet 指出,優先布局歐洲的原因在於當地擁有頂尖人才,且歐洲深厚的工業基礎本身就是 Genesis AI 的首要市場。
Genesis AI 目前鎖定汽車、電子、製藥與物流等產業,目標是解決傳統機器人難以處理的精細或變動性任務,例如電子業中極度困難的「線束整理」,因為需要將電纜整理成束並固定,這正是 Genesis AI 能大展身手的地方。
另一方面,為了持續擴充機器人的技能庫,Genesis AI 正與工業夥伴洽談,計畫讓數萬名實驗室技術員或製造業員工在日常工作中配戴感測手套,並搭配第一人稱視角影片來蒐集真實世界資料。這次的技術發表,也讓 Genesis AI 與同樣開發工業靈巧手、估值上看 60 億美元的中國新創 Linkerbot 展開直接競爭。
Genesis AI 預計很快就會公開第一款通用的機器人,正如 Zhou Xian 所強調的,他們的最終目標是「打造最有能力的機器人系統」。因此,GENE-26.5 的真正價值是將 AI 模型、仿人機械手、資料手套與模擬系統進行深度整合,並透過這套系統,讓 Genesis AI 正面突破機器人走向真實世界時最困難的「手部操作」瓶頸,並讓 Physical AI 真正具備執行複雜任務的能力,逐步實現 Zhou Xian 眼中「十年內,工廠機器人與家用機器人將不再有根本差異」的長遠願景。
*本文開放合作夥伴轉載,資料來源:《TechCrunch》、《Reuters》、《The Robot Report》、《Business Insider》,圖片來源:Genesis AI