中國科技巨頭赴海外訓練AI模型 為繞過美國封鎖搶輝達晶片
為了繞開美國對中國發展高階人工智慧的封鎖,中國多家大型科技公司索性直接把人工智慧模型的訓練工作搬到海外,以便取得美國晶片大廠輝達的晶片。
美國政府自2023年起開始加強高階晶片出口到中國的管制,輝達(Nvidia)因此以H100晶片為基礎,專門為中國設計打造降規版H20晶片。不過,美國總統川普政府今年4月也對H20晶片進行出口管制,禁止向中國市場出口此晶片,雖然之後鬆綁相關法規,讓輝達可以繼續販售。然而,金融時報引述消息人士報導,自H20晶片一度被禁後,中國企業在海外進行人工智慧訓練的情況便穩定增加,像是中國電商龍頭阿里巴巴、短影音平台抖音的母公司字節跳動,正把旗下最新的大型語言模型(LLM)搬到東南亞多個資料中心進行訓練。
知情人士表示,中國企業通常會與海外資料中心簽訂租賃協議,這些海外資料中心由非中資企業持有並營運。一名位於新加坡的資料中心營運商點出中國企業將AI模型搬到海外訓練的原因,「你需要最好的晶片才能訓練最尖端的模型,而這裡的一切都完全合法。」受到中國需求帶動,新加坡與馬來西亞的資料中心群近年來快速擴張,許多資料中心都配備著高階的輝達晶片,類似美國大型科技公司用於訓練大型語言模型的設備。這種做法符合美國出口管制規定,因為拜登時期為堵住這類漏洞而設計的「擴散規則(diffusion rule)」已在今年稍早被美國總統川普取消。
但也有例外,先前以低成本、高品質聞名的中國人工智慧公司深度求索(DeepSeek)是在中國境內進行AI模型訓練。消息人士指出,該公司在美國出口禁令生效前,就已經提前建立了不小規模的輝達晶片叢集;同時,DeepSeek也正與以中國電訊龍頭華為為首的國內晶片製造商密切合作,優化並開發下一代中國AI晶片。
華為把這項合作視為戰略性任務,想藉此推動該公司半導體與軟體系統的進步,並讓這些技術被廣泛使用於全國各地的AI訓練。但訓練大型語言模型需要大量運算能力來處理海量資料,因此多數中企仍偏好使用輝達尖端晶片。不過,有一項限制是中國科季巨頭不得將私人資料搬移出境,這代表若要根據本地客戶提供的特定資料來客製化AI模型,訓練就必須留在中國境內。