「實體 AI 最終會在虛擬世界誕生。」NVIDIA 解密 AI 機器人訓練戰略
NVIDIA 是 AI 機器人的倡議者,上個月剛在 GTC 大會發表全球首款開放人形機器人模型 GR00T N1 等一系列新品,要與產業共同打造 AI 機器人生態系的背後技術思考是什麼?
NVIDIA 台灣新創生態系暨機器人開發者關係負責人李昇達 4/9 出席 TechOrange 與 NVIDIA、 Amazon Web Services(AWS)共同主辦「AI 機器人產業論壇」,以「機器人世代的崛起:AI 及機器人技術大解析」為題發表演講,分享 NVIDIA 對於 AI 機器人的趨勢觀察,並強調資料在機器人訓練與任務執行中的關鍵角色。
揭開 NVIDIA 打造 AI 機器人大腦路線圖
李昇達一開場提到產業需要發展機器人的原因,他表示,第一個是缺工,第二個是勞力缺口已經大到國家 GDP 等級的程度,第三,世界上仍然有許多工作需要進入實體世界完成。他進一步解釋人形機器人亟具發展空間,因為 AI 能力提升、機器人硬體成本下降,且適合直接部署在為人類設計的建築設施之中,並且可運用網路上的大量開放資料。
李昇達指出,實體機器人的運作,由生成資料、訓練、部署形成循環,他在演講中,便提到 NVIDIA 建構通用機器人 AI 大腦的路線圖,一共有 3 個核心原則:通才、雙系統、資料金字塔。
首先是通才(Generalist),李昇達表示,機器人仍須先學會特定任務,才能逐步擴展反應能力。這也代表,各種應用情境會產生大量專屬資料。
第二個是雙系統(Dual System),就像人類的認知系統的「快思慢想」設計──分別由本能反應,以及需要經過大腦深思熟慮來決策判斷所組成。NVIDIA 新推出的 GR00T N1 基礎模型,即是採用雙系統架構,並且運用系統 2 進行視覺、文字理解,藉此感知環境。
第三個是資料金字塔(Data Pyramid),從上而下分別為真實世界資料、合成資料、網路資料。他表示,因為神經網路模型不見得認得所有場景,真實世界的資料仍是必要的。而真實資料結合合成資料,NVIDIA 正是運用 Isaac 平台,來針對特定任務,生成符合物理原則想像、適用於機器人訓練的資料。
如同生成式 AI,AI 機器人發展有 3 階段
李昇達也在論壇中分享,AI 機器人如同生成式 AI,發展有 3 個階段:從滿足特定任務的 AI,發展到全知全能的通用大腦,但是,因為多數企業沒有本錢去跑通用等級的 AI 大腦,所以會透過如 RAG 技術取得適合自家應用所需的大、小模型,打造成企業專屬自家的 AI 應用。
同樣地,AI 機器人的發展,將從執行特定任務的專業機器人(Specialist Robot Systems),發展到通用機器人(Generalist Robot Models),再進一步根據不同工作環境、居家場景進行客製化的通用機器人(Specialized Generalist Robot)。李昇達表示,NVIDIA 的 Project GR00T 模型,就是要成為 AI 機器人的通用型大腦。
實體 AI 最終會在虛擬世界產生
李昇達表示,AI 機器人仍然需要真實世界的資料,可以讓機器人了解部分能力,但合成資料可以生成更多情境變化的訓練場景。
「我認為,Physical AI(實體 AI)最終會在虛擬(Simulation)世界誕生,」他表示,NVIDIA 長期推動的 Omniverse 平台,提供大家建構真實世界所需的工具,是把現實世界的既有工具連結到虛擬世界;但後續推出的 Cosmos 平台,可以運用下提示詞(prompt)的方式,直接告訴 AI 想要生成什麼樣的場景,直接拿來提供機器人訓練,利用世界基礎模型加速實體 AI 開發。
立即預約收看「AI 機器人產業論壇」演講精華
【推薦閱讀】
◆ 「如果晶片要用機器人做,那誰做機器人?」數發部、NVIDIA、AWS 等專家齊聚 AI 機器人產業論壇,揭示 AI 機器人生態系成形
*本文開放合作夥伴轉載,圖片來源:TechOrange。