阿里巴巴推 AI 晶片與 Qwen3-Omni 全模態開源模型,劍指美國科技巨頭
中美兩國在 AI 領域的競爭日益激烈,目前 OpenAI、NVIDIA 和 Google 等美國科技巨頭仍佔據主導地位,但中國正積極採取應對策略,例如阿里巴巴同時在硬體和軟體兩端出擊,一方面積極推動國產晶片資料中心的建設,另一方面則發布開源的全模態模型,正面挑戰美國的霸權地位。
硬體戰線:建立國產 AI 晶片驅動的資料中心
首先在硬體部分,為了擺脫對外國技術的依賴,中國聯通在青海省西寧市斥資 3.9 億美元興建一座大型資料中心,目標算力將達到 20,000 petaflops。目前,該中心已利用近 23,000 枚國產 AI 晶片,建置 3,579 petaflops 的運算能力。
在這項資料中心國產化的計畫中,阿里巴巴扮演關鍵角色。根據《路透社》報導,這座資料中心約 72% 的晶片,都來自阿里巴巴旗下半導體晶片公司「T-Head」。T-Head 的 PPU AI 晶片具備 96GB 記憶體,並採用為 AI 半導體設計的垂直堆疊 DRAM 晶片,因此成為 NVIDIA H20 的有力競爭者。
這項成果不僅證明中國本土 AI 晶片能力顯著提升,也展現中國政府積極擺脫美國晶片的依賴,並建立自主可控算力基礎的決心。
軟體戰線:阿里巴巴 Qwen3-Omni 全模態開源模型
近日阿里巴巴的 Qwen AI 團隊發布開源大型語言模型 Qwen3-Omni。這款模型被定位為首個「原生端到端的全模態 AI」,能將文字、圖像、語音和影片統一在一個模型中,可以接受多模態輸入,但輸出模態僅限於文字和語音。
Qwen3-Omni 採用對企業友善的 Apache 2.0 授權,因此可以被自由下載、修改和部署,甚至允許用於商業應用,同時也降低將模型整合到專有系統中的法律風險。
在技術上,Qwen3-Omni 採用「Thinker–Talker 架構」,其中「Thinker」負責推理和多模態理解,「Talker」則負責生成語音音訊。Qwen3-Omni 將所有模態從一開始就整合在一起,而非在文字模型上附加功能,並在多個指令同時發生的情境下,Qwen3-Omni 也展現出十分出色的低延遲表現。
相較於 OpenAI 的 GPT-4o 和 Google 的 Gemini 2.5 Pro 這些專有模型,阿里巴巴的 Qwen3-Omni 選擇開源策略,它的開放性及文字與語音的雙輸出能力,已經成為市場上的獨特存在。
算力與模型的雙重戰略
面對美國政府的貿易管制壓力,中國正加速推動「去美國化」的晶片戰略,並積極支持國產晶片與開發自有 AI 模型。
阿里巴巴在軟硬體的雙線作戰策略,標誌著中國 AI 戰略與中美科技競爭已進入新階段,而這場算力與模型的雙重挑戰,正逐步改寫全球 AI 版圖。
*本文開放合作夥伴轉載,資料來源:《Reuters》、《VentureBeat》,首圖來源:Unsplash。