DeepSeek 帶起的骨牌效應:中國開源 AI 模型如何重塑全球 AI 創新格局
過去一年,中國開源 AI 走到了一個關鍵轉折點。自從 DeepSeek 在 2025 年 1 月推出 R1 推理模型後,中國企業接連端出效果逼近西方先進模型、價格卻低得多的新模型,讓開源模型不再只是研究社群的玩具,而是從 Hugging Face 一路滲透到矽谷產品線、企業內部工具與新創技術堆疊的核心。
《MIT Technology Review》形容,這波變化之所以值得警惕,不只在於中國模型成了取得前沿 AI 能力最便宜的選擇,更可能改變創新發生的地點,以及誰來制定技術標準的權力結構。背後關鍵原因是越來越多中國公司選擇開源,讓全球開發者可以下載、部署、研究與改造,而不是像多數美國閉源模型一樣只能付費用 API、卻看不到模型內部細節。
就在近日,中國公司 Moonshot AI 發表了最新的開放權重模型 Kimi K2.5,在部分早期基準測試中,其表現已接近頂級閉源 AI,例如 Anthropic 的 Claude Opus,而兩者差別在於 K2.5 的價格僅約 Opus 的七分之一。一項近期的 MIT 研究更發現,中國開源模型的總下載量已經超過美國模型。
中國開源模型正在變成全球 AI 基礎?
中國開源模型的擴散,不只停留在下載排行榜。《MIT Technology Review》直接點名,這股採用潮正在矽谷浮現。創投 Andreessen Horowitz 合夥人 Martin Casado 就在社群平台 X 表示,在使用開源技術堆疊的新創提案中,大約有 80% 機率正在跑中國模型。另一個指標是 OpenRouter 的 API 使用追蹤數據,中國開源模型的使用占比,從 2024 年底幾乎為零,爬升到近期某些週接近 30%。
根據《CNN》,社群平台 Pinterest 正在用中國開源模型優化推薦引擎,讓平台更像「AI 購物助理」。Airbnb 執行長 Brian Chesky 曾在去年 10 月接受《Bloomberg》訪問時表示,Airbnb 大量依賴阿里巴巴的 Qwen 模型來支撐 AI 客服代理,理由是「很強、很快、很便宜」。而根據《CNBC》報導,Z.ai 的用戶群主要集中在美國和中國,其次是印度、日本、巴西和英國。
為何中國更堅定走開源路線?
中國押注開源,並不是突發奇想。《MIT Technology Review》指出,中國擁有僅次於美國的 AI 人才密度,以及資源充沛的科技產業體系。ChatGPT 風靡全球後,中國 AI 產業經歷了一波集體再校準,而開源被視為追趕差距、號召開發者、加速採用並建立標準的最快路徑。
開源也在中國形成了一種社群與文化的「政治正確」。中國清華大學電腦科學教授、ModelBest 首席科學家劉知遠告訴《MIT Technology Review》,中國企業透過釋出開源 AI 研究成果累積聲譽與免費曝光,而在中國程式社群中,開源逐漸變成對抗美國閉源模型的主流選擇。同時政策端也推波助瀾,例如中國國務院在 8 月公布草案,提議大學把學生在 GitHub 或 Gitee 的開源貢獻納入學分評估。
不過,開源模式能否長期成立,終究要回到財務結果。Hugging Face 全球 AI 負責人 Tiezhen Wang 觀察,當前產業更像是在「把餅做大」,下一關將是「每家公司如何拿到自己的那一塊」。報導也提到,Z.ai(前身為 Zhipu)與 MiniMax 已在 2026 年 1 月於香港上市,顯示資本市場開始要求更明確的商業化路徑。
下一波中國開源 AI 趨勢:更小、更專業
《MIT Technology Review》預測,中國下一波 AI 模型將更小、更專業。舉例來說,阿里巴巴的 Qwen 模型已成為目前最完整的開源模型家族之一,提供多種針對不同用途優化的版本。其產品線涵蓋可在單一筆電運行的輕量模型,到部署於資料中心、擁有數千億參數的大型系統。此外,其社群也開發出多種任務導向版本,例如擅長理解與執行指令的 instruct 模型,以及專門用於程式開發的 code 模型。
劉知遠表示,小型 AI 模型的崛起是為了降低 AI 的運作成本,並讓更多人更容易使用。雖然這種策略並非中國實驗室獨有,但《MIT Technology Review》指出,Qwen 是第一個推出如此多高品質選項的開源模型家族,使其更像一條完整且可免費使用的產品線。
中國的開源模型也將日趨專業化。Tiezhen Wang 指出,成本是中國開源模型獲得市場認可的主要原因,但如果只將之視為西方前沿系統的「仿製品」是一種誤解。舉例來說,上海 AI 實驗室等研究團隊發布了以科學和技術任務為導向的模型;騰訊的多個專案則專注於音樂生成;與 DeepSeek 母公司 High-Flyer 類似的量化金融公司 Ubiquant,也發表了一款開源醫學推理模型。
同時,中國實驗室的創新架構理念正被更廣泛借鏡,像是 DeepSeek 發表的論文探討了模型效率和記憶體使用問題,劉知遠指出,因為其為開源模型、可以快速被整個產業採用,因此這些研究突破的影響力也被放大。
調研機構 Gartner 副總裁 Julian Sun 告訴《CNBC》,隨著 AI 競爭正在從「模型性能」轉向「價值實現」,這可能對於中國 AI 來說是一大利多,但美國在先進半導體、前沿模型研究和超大規模資料中心基礎設施的領域,持續保持領先地位,並吸引投資者和企業的大量資金。事實上,中美兩國的開源系統緊密相連,Wang 表示,許多中國開源模型仍然依賴美國的雲端平台進行訓練和服務,人才流動性也很強。
Sun 認為,全球 AI 競爭格局將呈現「多極化」狀態,涵蓋技術堆疊的不同層面,而非由單一生態系主導。《MIT Technology Review》表示,過去十年,中國科技在西方常是一開始被看好,後來會遭遇審查、限制或政治反彈,但這次中國輸出的不是 App,而是其他公司拿來打造產品的 AI 模型基礎,而這會不會改變過去的發展軌跡,現在還很難說。
*本文開放合作夥伴轉載,資料來源:《MIT Technology Review》、《CNBC》、《CNN》,首圖來源:Unsplash