DeepSeek V4亮相!開源策略與華為晶片 迎中美AI新競局
Newtalk新聞
綜合外媒報導,中國 AI 新創 DeepSeek 於週五發布 V4 模型預覽版,主打更強推理與代理式能力,並採開源策略與華為合作運算。該公司自 2025 年 R1 模型崛起後備受關注,此次升級被視為延續中美 AI 競爭的重要一步,但分析師認為市場反應將不若前次震撼。
根據《CNN》報導,中國 AI 新創 DeepSeek 於週五推出備受期待的 V4 模型預覽版,宣稱將能與 OpenAI、Anthropic 以及 Google 等美國企業模型競爭。該公司表示,新模型在推理能力與「代理式」能力上大幅升級,可代表使用者自主執行任務,例如撰寫程式碼,同時在處理大量「token」時效率顯著提升。
DeepSeek 自 2025 年推出 R1 模型後迅速崛起,該模型以接近業界領先的表現、但成本僅為其一小部分,引發全球關注。當時甚至導致美國 AI 相關股票下跌,並引發市場對資料中心持續擴張投資的質疑,同時也提振外界對中國科技實力的信心,進一步加劇中美科技競爭。
不過《CNN》進一步指出,分析師對此次 V4 發布的市場影響持較保守態度。金融服務公司 Morningstar 資深股票分析師 Ivan Su 指出,R1 之所以震撼市場,在於當時外界未預期中國模型能達到該競爭水準,而 V4 僅是延續既有趨勢,難以再現突發性衝擊。他並表示,市場早已反映中國 AI 具備高競爭力且成本較低的現實,因此此次反應預期有限。
與過去模型相同,V4 採開源模式,允許任何人使用,與多數美國封閉式模型形成對比。此一策略被視為中國在 AI 競爭中的關鍵手段,透過快速擴大應用規模,將技術導入電子商務與機器人等多個產業,同時也反映中國 AI 企業在資金相對有限及美國出口管制下難以取得先進晶片的現實。
外媒指出,在硬體方面,DeepSeek 此次與華為合作,利用其「Ascend 950」晶片集群支撐運算需求。市場研究機構 Counterpoint Research 首席分析師 Wei Sun 指出,V4 採用華為及中國晶片商 Cambricon 的本土晶片運行,相較 R1 依賴 Nvidia 硬體訓練,顯示中國正降低對美國技術依賴。
Wei Sun 表示,此舉使 AI 系統在建置與部署上不必完全仰賴 Nvidia,V4 未來可能帶來比 R1 更深遠的影響,包括加速中國國內採用並推動全球 AI 發展。儘管如此,目前產業頂端仍由美國封閉式模型主導,包括 Anthropic 的 Claude、OpenAI 的 ChatGPT 以及 Google 的 Gemini。DeepSeek 則在聲明中強調,V4 在開源模型中具備最佳代理式編碼能力,並達到「世界級」推理水準,但仍承認在部分領域落後於 Gemini 等領先模型。
然而,DeepSeek 的快速崛起也伴隨爭議。Anthropic 與 OpenAI 曾指控該公司透過「蒸餾」方式,非法提取其模型能力。美國白宮科技政策辦公室主任 Michael Kratsios 亦於週四指出,主要位於中國的外國實體正進行大規模行動,從美國公司蒸餾前沿 AI 模型。儘管未直接點名 DeepSeek,但在中美關係持續緊張之際,相關指控再度將其推上輿論焦點。
CNN 指出,目前已向 DeepSeek 詢問對相關指控的回應,尚未獲得進一步說明。