讓機器人可以從錯誤中學習!開發者如何借力 NVIDIA Isaac GR00T 在虛擬環境訓練適應真實世界的機器人?
你曾經想像過,未來機器人會以什麼樣貌出現在生活中嗎?「我們認知的 humanoid(人形機器人),是多功能的,」NVIDIA 資深解決方案架構師吳志忠在近日舉辦的「AI 機器人產業論壇」的 Workshop 中,以「運用強化學習技術於 NVIDIA 機器人平台 —NVIDIA IsaacTM GR00T 的高效訓練實踐」為主題,介紹 NVIDIA 為加速通用型機器人發展所打造的訓練工具。吳志忠強調,機器人將從單一功能的工具,進化為具備站立、行走、抓取、操作工具等能力的多功能平台,甚至能主動適應環境、從錯誤中學習。
例如,現在讓機器人「會走路」並不難,但要「走得靈活」,並在不同地形與環境下保持穩定,仍具有不小的技術門檻。為強化機器人的能力,NVIDIA 打造 Isaac GR00T 平台,整合運動控制、資料生成與模型訓練三大核心面向,幫助開發者在 NVIDIA OmniverseTM 虛擬環境中產出數以萬計的模擬數據,訓練出可以適應真實環境的機器人控制模型。
不只讓機器人走得穩,還可以因應環境調整行走策略
吳志忠說明,在運用 Isaac GR00T 開發機器人的流程中,開發者可以透過 GR00T workflows 建立資料收集的管道,並使用 mimic 來產生多樣化的動作集,進而透過 NVIDIA CosmosTM 生成高度擬真的訓練資料。 最後再搭配強化學習演算法,讓機器人反覆「試走」、「試摔」、「試調整」,從中學會如何在不確定的場景中保持穩定與靈活。
在 Workshop 現場,吳志忠採用傳統控制邏輯與使用 Isaac GR00T 訓練的兩台機器人進行對比,結果顯示借力 Isaac GR00T 訓練的機器人不僅步態更加穩定,還能在環境變化下主動調整行走策略,展現出類似人類的適應能力。
然而,想要成功訓練機器人模型,關鍵就在於數據是否夠多樣。吳志忠指出,Isaac GR00T 所提供的虛擬訓練與模擬平台,讓開發者得以在無風險的虛擬空間中創造數萬筆模擬資料,不僅節省實體測試時間,也能降低硬體損耗,大幅提升訓練效率。
此外,Isaac GR00T 也將機器人的「感知—決策—執行」流程標準化與模組化,讓開發者不需要從零開始設計演算法,而是能快速利用虛擬環境中的資料收集與複製來不斷調整運動模組與控制邏輯,進而更聚焦在訓練與優化層面,加速開發時程。
從雲端訓練到邊緣部署,NVIDIA 提供完整技術與硬體支援
為支援模型的訓練與部署,NVIDIA 也提供 DGX、OVX 與 AGX 完整硬體支援。DGX 可以為 AI 模型訓練的核心平台提供高效運算資源;OVX 能專注於數位孿生與虛擬模擬的圖形運算;AGX 則作為邊緣 AI 平台,部署在機器人本體,協助模型即時推論與執行。 DGX、OVX 與 AGX 三者提供從雲端訓練到邊緣部署的關鍵基礎,讓機器人可以加速落地應用的腳步。
除了訓練與部署,NVIDIA 也將推出 XR Teleoperation 功能,讓開發者能夠透過沉浸式 XR 介面遠端即時操作 Omniverse 環境中的虛擬機器人,並同時收集操作數據,進一步訓練模型並優化表現,加速模型學習與開發進程。
未來,不僅開發與部署機器人的效率更快,透過 Isaac GR00T 所打造的機器人,使用場景不只侷限於工廠,還能擴展至物流搬運、醫療輔助與家庭陪伴等場域。當機器人可以在不斷累積資料、反覆訓練的過程中自我調整策略,人與機器人的互動模式也將從單純的控制與反應,轉變為彼此協作、共同完成任務的全新型態。