降低 CUDA 生態系依賴，DeepSeek 新模型獲華為昇騰、寒武紀、海光支援

中國 AI 公司 DeepSeek 發表最新模型DeepSeek-V3.2-Exp 之際，為華為昇騰（Ascend）晶片及其 CANN（Compute Architecture for Neural Networks）運算架構提供最佳化。此舉代表 DeepSeek 重心轉移，確保先進模型能在中國製 AI 加速器運行，不再一味依賴 NVIDIA CUDA 生態系。

隨著 DeepSeek-V3.2-Exp 發表，華為昇騰團隊及相關的 vLLM-Ascend 社群迅速整合新模型。在 vLLM-Ascend 的儲存庫中，新的項目概述昇騰 NPU 的自訂安裝步驟與內核封裝，以支援新模型。CANN 團隊也發表推理部署指南，使新模型能在華為晶片上部署。

其他中國晶片供應商相繼支援，包括寒武紀更新 vLLM-MLU 分支以相容 DeepSeek-V3.2-Exp，宣稱其推理引擎與新模型的稀疏注意力機制結合，可降低長序列處理成本。海光也表示其 DCU 加速器透過 DTK 軟體堆疊進行調校，可做到「零等待」（zero-wait）部署。

同時，推理框架 SGLang 確認 DeepSeek-V3.2-Exp 可支援多種後端（包含昇騰在內），而 DeepSeek 在 GitHub 的說明則暗示，新模型推出時可達到與 vLLM 相當的相容性。DeepSeek 也提及高階語言 TileLang 與 CUDA 內核，並建議研究人員開發原型時以 TileLang 為主。實際上，這意味著同一個模型檔案經過少量調整，就能在 NVIDIA GPU 與中國加速器之間部署。

此一採用速度之快，凸顯中國 AI 生態系正在為無法理所當然取得 NNVIDIA 硬體的未來做準備。雖然 NVIDIA 的 CUDA 在訓練與推理領域保持主導地位，但 DeepSeek 最新版本是少數中國公司在發表首日即為非 CUDA 軟體堆疊提供最佳化的產品。

（首圖來源：Unsplash）

立刻加入《科技新報》LINE 官方帳號，全方位科技產業新知一手掌握！

請更新您的瀏覽器

理財

科技新報

更多理財相關文章

不是醫生、工程師！全台「1行業」最賺錢　平均月薪飆破7萬元

從破產邊緣到晶片之巔：SK海力士的HBM傳奇與AI時代的逆襲

自行車業寒冬，捷安特為何敢開大店？揭開「不只賣車」的逆襲盤算

中油董座認了！也找聶永真設計新LOGO但考量虧損已暫緩實施

獨家》承億創辦人54歲戴俊郎意外辭世震撼旅宿業

台灣普利司通資遣員工551人！公司證實：新竹廠即日起結束營運

請更新您的瀏覽器啟用Javascript