請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

DeepSeek V4 登場:程式生成能力稱霸開源陣營,全面支援華為昇騰產品線

TechOrange 科技報橘

更新於 04月24日16:53 • 發布於 04月24日08:51 • 廖紹伶

DeepSeek 於本週五正式發布旗艦模型系列 V4 的預覽版,距離其 R1 推理模型引發全球 AI 市場震盪已超過一年。這次發布共包含兩個版本:擁有 1.6 兆參數的 DeepSeek-V4-Pro,以及規模較小、擁有 2,840 億參數的 DeepSeek-V4-Flash,兩者均支援 100 萬 token 的上下文窗口,並已於 Hugging Face 開源釋出。

程式撰寫能力稱霸開源陣營

DeepSeek 表示,V4-Pro 在 Agentic 程式碼生成基準測試中位居開源模型之首。根據專門追蹤 AI 技術效能的 Vals AI 公司測試,V4 在程式碼生成方面的表現顯著優於所有其他開源模型。Vals AI 執行長 Rayan Krishnan 指出,DeepSeek V4 與 Moonshot AI 旗下的 Kimi 2.6「基本上並駕齊驅」。

DeepSeek 自家員工也已在日常 AI 輔助程式開發中大量使用 V4,其內部反饋指出,V4-Pro 的輸出品質已接近 Anthropic 旗艦模型 Claude Opus 4.6 的非推理模式,但在推理模式下仍落後後者。

在智識問答和世界知識領域,V4-Pro-Max(V4-Pro 的最高推理努力模式)宣稱在開源模型中領先,但仍落後於閉源龍頭 Gemini-3.1-Pro。在推理能力方面,DeepSeek 也宣稱 V4-Pro 超越目前所有開源模型,可與頂尖的閉源模型相媲美。不過整體而言,DeepSeek 坦承,目前 V4 與全球最前沿模型的進展落後約 3 至 6 個月。

圖片來源:DeepSeek。

定價方面,V4-Pro 的 API 價位約為每百萬輸入 token 1.80 美元、每百萬輸出 token 3.50 美元,遠低於 Anthropic Claude Opus 4.6 的每百萬輸出 token 25 美元,以及 OpenAI GPT-5.5 的每百萬輸出 token 約 30 美元。

新注意力機制壓低運算成本

在架構層面,V4 最核心的創新是其混合注意力架構,結合了「壓縮稀疏注意力」(CSA)與「重度壓縮注意力」(HCA)兩種機制。DeepSeek 解釋,此設計在 token 層級對資訊進行壓縮,讓模型能更有效率地處理資料,並專注於關鍵訊息,同時在處理長輸入資料時消耗更少的運算能力與記憶體。

根據 DeepSeek 技術報告,在 100 萬 token 的上下文情境下,V4-Pro 所需的單 token 推理浮點運算量僅為前代 DeepSeek-V3.2 的 27%,KV 快取(Key-Value Cache)大小則僅為 V3.2 的 10%。規模更輕巧的 V4-Flash 效率更進一步,在同等情境下,推理浮點運算量降至 V3.2 的 10%,KV 快取僅佔 7%。

國產晶片整合與算力瓶頸

《日經亞洲》報導,近期傳出 DeepSeek 與華為可能展開合作,引發 NVIDIA 執行長黃仁勳警告,若 DeepSeek 的模型最終運行在華為晶片上,對美國而言將是「非常不利的結果」。他指出,一旦中國建立起獨立的技術生態系,長期可能取代美國主導的技術標準,並在全球擴散。

DeepSeek 就在這次發表確認,已驗證 V4 核心效率技術可同時在 NVIDIA GPU 與華為昇騰 NPU 上運行,華為方面也表示,其整個昇騰產品線現已為 DeepSeek V4 模型提供全棧支援。不過 DeepSeek 在微信貼文中表示,V4-Pro 系列的服務容量目前極為有限,原因是運算資源吃緊,但預計在華為昇騰 950 晶片集群於今年下半年上線後,API 定價將顯著下調。

這次發表也在 DeepSeek 首輪外部融資的背景下進行。據《The Information》與《華爾街日報》報導,騰訊與阿里巴巴正就投資 DeepSeek 進行洽談,估值逾 200 億美元。

中國開源 AI 擴張全球影響力

V4 的登場,進一步鞏固中國開源 AI 的全球布局。《紐約時報》報導,據美國一份國會顧問機構的最新研究,中國大力發展開源 AI 已成為其重大經濟優勢,應用遍及機器人、物流與製造等產業,並藉此在全球累積影響力。去年,中國開源模型約佔全球 AI 使用量的三分之一,DeepSeek 為其中使用最廣泛的模型,其次為阿里巴巴旗下模型。馬來西亞副通訊部長去年 5 月表示,該國主權 AI 基礎設施將建立在 DeepSeek 的技術之上,顯示其在新興市場的滲透力。

V4 的發布也預示著中國 AI 市場新一輪的激烈競爭。就在 DeepSeek 發布 V4 前夕,Moonshot AI 推出了開源模型 Kimi 2.6,主打長週期程式碼生成與自主執行能力;本月稍早,阿里巴巴發布了 Qwen3.6-Plus,用於加速企業端的 AI Agent 部署;上個月,智譜 AI 也推出了具備強力程式碼能力的 GLM-5.1。V4 的到來,讓這場本已白熱化的開源模型競賽再添變數。

【推薦閱讀】

6 週就推新 AI、推論成本砍到 1/35,拆解 OpenAI GPT-5.5 的企業端鎖定戰略

Anthropic 發表新 AI 模型 Claude Opus 4.7,攻向「可控 AI」新戰場

Anthropic 不敢全面公開的 AI:Claude Mythos 為何正在重寫網路安全規則?

*本文開放合作夥伴轉載,資料來源:《Bloomberg》《CNBC》《The New York Times》《Nikkei Asia》《The Information》《The Wall Street Journal》GitHubDeepSeek,首圖來源:Unsplash

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

影/黃仁勳罕見變臉:妳太難搞了!女粉「失禮」影片瘋傳

EBC 東森新聞
02

台積電進駐熊本:把一隻鯨魚塞進水桶裡 投資客亂入 工業地、住宅都惡性大漲

信傳媒
03

遭狂粉塞鈔票求簽名! 黃仁勳難得變臉「死亡凝視3秒」:妳太麻煩了

鏡週刊
04

〈美股早盤〉博通重挫拖累晶片股 主要指數漲跌互現

anue鉅亨網
05

女粉絲狂塞日幣討簽名!黃仁勳罕見動怒 皺眉無奈喊:妳太難搞了

三立新聞網
06

台股大漲你獨賠?股市韭菜公開「死亡筆記本」 網友勸「全部賣掉買這檔」

風傳媒
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...