DeepSeek V4 登場:程式生成能力稱霸開源陣營,全面支援華為昇騰產品線
DeepSeek 於本週五正式發布旗艦模型系列 V4 的預覽版,距離其 R1 推理模型引發全球 AI 市場震盪已超過一年。這次發布共包含兩個版本:擁有 1.6 兆參數的 DeepSeek-V4-Pro,以及規模較小、擁有 2,840 億參數的 DeepSeek-V4-Flash,兩者均支援 100 萬 token 的上下文窗口,並已於 Hugging Face 開源釋出。
程式撰寫能力稱霸開源陣營
DeepSeek 表示,V4-Pro 在 Agentic 程式碼生成基準測試中位居開源模型之首。根據專門追蹤 AI 技術效能的 Vals AI 公司測試,V4 在程式碼生成方面的表現顯著優於所有其他開源模型。Vals AI 執行長 Rayan Krishnan 指出,DeepSeek V4 與 Moonshot AI 旗下的 Kimi 2.6「基本上並駕齊驅」。
DeepSeek 自家員工也已在日常 AI 輔助程式開發中大量使用 V4,其內部反饋指出,V4-Pro 的輸出品質已接近 Anthropic 旗艦模型 Claude Opus 4.6 的非推理模式,但在推理模式下仍落後後者。
在智識問答和世界知識領域,V4-Pro-Max(V4-Pro 的最高推理努力模式)宣稱在開源模型中領先,但仍落後於閉源龍頭 Gemini-3.1-Pro。在推理能力方面,DeepSeek 也宣稱 V4-Pro 超越目前所有開源模型,可與頂尖的閉源模型相媲美。不過整體而言,DeepSeek 坦承,目前 V4 與全球最前沿模型的進展落後約 3 至 6 個月。
定價方面,V4-Pro 的 API 價位約為每百萬輸入 token 1.80 美元、每百萬輸出 token 3.50 美元,遠低於 Anthropic Claude Opus 4.6 的每百萬輸出 token 25 美元,以及 OpenAI GPT-5.5 的每百萬輸出 token 約 30 美元。
新注意力機制壓低運算成本
在架構層面,V4 最核心的創新是其混合注意力架構,結合了「壓縮稀疏注意力」(CSA)與「重度壓縮注意力」(HCA)兩種機制。DeepSeek 解釋,此設計在 token 層級對資訊進行壓縮,讓模型能更有效率地處理資料,並專注於關鍵訊息,同時在處理長輸入資料時消耗更少的運算能力與記憶體。
根據 DeepSeek 技術報告,在 100 萬 token 的上下文情境下,V4-Pro 所需的單 token 推理浮點運算量僅為前代 DeepSeek-V3.2 的 27%,KV 快取(Key-Value Cache)大小則僅為 V3.2 的 10%。規模更輕巧的 V4-Flash 效率更進一步,在同等情境下,推理浮點運算量降至 V3.2 的 10%,KV 快取僅佔 7%。
國產晶片整合與算力瓶頸
《日經亞洲》報導,近期傳出 DeepSeek 與華為可能展開合作,引發 NVIDIA 執行長黃仁勳警告,若 DeepSeek 的模型最終運行在華為晶片上,對美國而言將是「非常不利的結果」。他指出,一旦中國建立起獨立的技術生態系,長期可能取代美國主導的技術標準,並在全球擴散。
DeepSeek 就在這次發表確認,已驗證 V4 核心效率技術可同時在 NVIDIA GPU 與華為昇騰 NPU 上運行,華為方面也表示,其整個昇騰產品線現已為 DeepSeek V4 模型提供全棧支援。不過 DeepSeek 在微信貼文中表示,V4-Pro 系列的服務容量目前極為有限,原因是運算資源吃緊,但預計在華為昇騰 950 晶片集群於今年下半年上線後,API 定價將顯著下調。
這次發表也在 DeepSeek 首輪外部融資的背景下進行。據《The Information》與《華爾街日報》報導,騰訊與阿里巴巴正就投資 DeepSeek 進行洽談,估值逾 200 億美元。
中國開源 AI 擴張全球影響力
V4 的登場,進一步鞏固中國開源 AI 的全球布局。《紐約時報》報導,據美國一份國會顧問機構的最新研究,中國大力發展開源 AI 已成為其重大經濟優勢,應用遍及機器人、物流與製造等產業,並藉此在全球累積影響力。去年,中國開源模型約佔全球 AI 使用量的三分之一,DeepSeek 為其中使用最廣泛的模型,其次為阿里巴巴旗下模型。馬來西亞副通訊部長去年 5 月表示,該國主權 AI 基礎設施將建立在 DeepSeek 的技術之上,顯示其在新興市場的滲透力。
V4 的發布也預示著中國 AI 市場新一輪的激烈競爭。就在 DeepSeek 發布 V4 前夕,Moonshot AI 推出了開源模型 Kimi 2.6,主打長週期程式碼生成與自主執行能力;本月稍早,阿里巴巴發布了 Qwen3.6-Plus,用於加速企業端的 AI Agent 部署;上個月,智譜 AI 也推出了具備強力程式碼能力的 GLM-5.1。V4 的到來,讓這場本已白熱化的開源模型競賽再添變數。
【推薦閱讀】
◆ 6 週就推新 AI、推論成本砍到 1/35,拆解 OpenAI GPT-5.5 的企業端鎖定戰略
*本文開放合作夥伴轉載,資料來源:《Bloomberg》、《CNBC》、《The New York Times》、《Nikkei Asia》、《The Information》、《The Wall Street Journal》、GitHub、DeepSeek,首圖來源:Unsplash