150 家新創湧入、百億資金重砸訓練場!拆解中國「具身 AI」狂潮背後的基建紅利與泡沫危機
當全球目光聚焦於大型語言模型(LLM)的軟體競爭時,AI 的戰場已從虛擬網路擴大至實體世界。中國正以舉國之力,加速建立龐大的人形機器人訓練基礎設施,試圖在這場被稱為「具身 AI」(embodied AI)的新世代科技革命中取得領先優勢。
根據《Financial Times》報導,在中國武漢,一座面積達 1.2 萬平方公尺的機器人訓練中心裡,年輕操作員每天透過遙控與感測裝置,反覆教導人形機器人端包子、擦桌子、摺衣服。這些動作會被鏡頭與感測器完整記錄,再整理成可供模型訓練的資料。該中心每天可產出約 100 小時可用資料,目標不是做出一台會表演的機器人,而是建立一個足以支撐整個產業成長的資料池。
中國大蓋「機器人訓練農場」
這座位於中國湖北的訓練中心,並不是單一案例。《Financial Times》與《Rest of World》都指出,這類由地方政府支持、機器人公司營運的資料收集與訓練設施,正在中國各地快速擴張。到 2025 年底,中國已宣布超過 40 座國有或官方支持的機器人資料中心,其中約 24 座已投入運作。光是湖北省,就推出規模達人民幣 100 億元的人形機器人基金;北京、上海、杭州、綿陽等地,也都在加速建立具身 AI 訓練場域。
背後的政策訊號也愈來愈明確。中國政府已在 2026 至 2030 年五年計畫中,將「具身智能」列為六大未來產業之一,並明確要求發展訓練中心、AI 模型與硬體,加速人形機器人落地。這代表中國對人形機器人的期待,已不只是單一技術展示,而是把它視為下一輪科技與產業競爭的核心基礎設施。
LLM 吃網路文字,機器人得靠人類一遍遍示範
為什麼中國政府願意投入大量資金蓋這些設施?答案在於,人形機器人的瓶頸並不只是硬體,也不只是模型,而是資料。
《Financial Times》指出,像 ChatGPT、DeepSeek 這類大型語言模型之所以能快速取得突破,關鍵在於它們能吃進海量網路文本。但機器人不同,它需要的不是單純文字,而是視覺、關節角度、速度、扭矩、動作順序,以及真實環境下的操作回饋。這些資料無法直接從網路抓取,也很難只靠模擬環境生成。
《Los Angeles Times》對印度資料標註公司的報導,也從另一個角度印證這件事。為了教機器人學會摺毛巾,工程師得頭戴 GoPro,一次又一次精準重複同樣動作,再把影片逐格標註,標記手臂怎麼移動、手指怎麼抓取、布料怎麼滑動。換句話說,讓 AI 學會「在真實世界裡怎麼動」,比教它在網路上「怎麼說」困難得多。
武漢訓練中心的員工張佳對《Financial Times》説,他們就像老師,而機器人是學生。教人類做動作,重複幾次就能學會;但教機器人不一樣,同一個動作得重複數百、數千,甚至上萬次。
中國人形機器人優勢,正從製造擴大到資料基礎設施
中國之所以能在這條路上快速推進,並不只是因為它有更多機器人公司。《TIME》指出,中國在電動車、感測器、減速器、控制器與電池等相鄰產業已建立大規模製造能力,讓機器人關鍵零組件成本大幅下降。這讓中國不只在硬體供應鏈上占優勢,也能更快部署更多機器人,進一步蒐集更多資料,形成規模飛輪。
報導提到,中國目前掌握全球約 70% 的光達市場,並在關節、控制器與諧波減速器等關鍵零件上快速壯大。當硬體成本下降、部署數量增加,機器人公司就更有機會在真實環境中蒐集資料,反過來再訓練更好的模型。《TIME》甚至直言,誰能更快部署機器人,誰就更可能收集到更大量、更高品質的資料,而這會進一步推動技術進步。
然而《Rest of World》也引述 Omdia 分析師 Lian Jye Su 的說法指出,中國目前在量產規模上領先,美國公司則仍在硬體與軟體技術面保持強勢。
這場競爭也可能演變成泡沫與過剩?
不過,資料農場模式並非沒有風險。《Rest of World》指出,地方政府大力投入雖能幫助小型新創取得原本負擔不起的訓練場地與資料,但也可能導致過剩。中國目前已有超過 150 家人形機器人公司,連中國國家發改委都曾公開警告該產業的泡沫風險。
此外,研究界對「大規模人工示範資料」是否真是通往通用機器人的最佳路徑,也還沒有共識。有些研究者認為,數位模擬、合成資料,或來自已部署機器人的實際操作資料,可能更有效率。加州大學柏克萊分校機器人學者 Ken Goldberg 就對《Rest of World》表示,這種資料收集方式「很慢」,即使有數百人一起做,也要花很長時間才能累積足夠資料。
這也意味著,中國現在做的事,某種程度上仍是高投入、高不確定性的基礎設施押注。它和大型語言模型早期的狀態有點像:短期看不到清楚回報,但若沒有先走這一步,後面也不可能出現大規模突破。
人形機器人競爭,正從硬體秀場走向資料基建戰
如果把中國春晚上的機器人跳舞、CES 展場上的炫技硬體,和武漢、北京、上海的資料訓練中心放在一起看,會發現中國正在複製一套它過去在電動車產業用過的路徑:先用政策與資金拉動供給,再透過大規模部署與本地市場,快速形成製造與資料優勢。
值得注意的,不是這些機器人能否完美摺衣服或端盤子,而是中國正在建立一個讓機器人持續學習、持續部署、持續回收資料的體系。這讓人形機器人競爭不再只是單一公司或單一產品的競爭,而是誰能更快打造完整資料基礎設施的競爭。
大型語言模型的時代,決勝點是誰掌握更多文本與算力;到了具身 AI 時代,決勝點可能會變成誰先建好足夠大的機器人訓練農場、誰先累積足夠多真實世界動作資料。從這個角度看,未來全球機器人產業的真正戰場,也許不是發表會舞台,而是那些看起來枯燥、重複、甚至有些無聊的資料工廠。
*本文開放合作夥伴轉載,資料來源:《Financial Times》、《TIME》、《The Rest of Word》1、《The Rest of word》2、《Los Angeles Times》,首圖來源:AI 工具生成