請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

降低 CUDA 生態系依賴,DeepSeek 新模型獲華為昇騰、寒武紀、海光支援

科技新報

更新於 2025年10月02日11:58 • 發布於 2025年10月02日11:14

中國 AI 公司 DeepSeek 發表最新模型DeepSeek-V3.2-Exp 之際,為華為昇騰(Ascend)晶片及其 CANN(Compute Architecture for Neural Networks)運算架構提供最佳化。此舉代表 DeepSeek 重心轉移,確保先進模型能在中國製 AI 加速器運行,不再一味依賴 NVIDIA CUDA 生態系。

隨著 DeepSeek-V3.2-Exp 發表,華為昇騰團隊及相關的 vLLM-Ascend 社群迅速整合新模型。在 vLLM-Ascend 的儲存庫中,新的項目概述昇騰 NPU 的自訂安裝步驟與內核封裝,以支援新模型。CANN 團隊也發表推理部署指南,使新模型能在華為晶片上部署。

其他中國晶片供應商相繼支援,包括寒武紀更新 vLLM-MLU 分支以相容 DeepSeek-V3.2-Exp,宣稱其推理引擎與新模型的稀疏注意力機制結合,可降低長序列處理成本。海光也表示其 DCU 加速器透過 DTK 軟體堆疊進行調校,可做到「零等待」(zero-wait)部署。

同時,推理框架 SGLang 確認 DeepSeek-V3.2-Exp 可支援多種後端(包含昇騰在內),而 DeepSeek 在 GitHub 的說明則暗示,新模型推出時可達到與 vLLM 相當的相容性。DeepSeek 也提及高階語言 TileLang 與 CUDA 內核,並建議研究人員開發原型時以 TileLang 為主。實際上,這意味著同一個模型檔案經過少量調整,就能在 NVIDIA GPU 與中國加速器之間部署。

此一採用速度之快,凸顯中國 AI 生態系正在為無法理所當然取得 NNVIDIA 硬體的未來做準備。雖然 NVIDIA 的 CUDA 在訓練與推理領域保持主導地位,但 DeepSeek 最新版本是少數中國公司在發表首日即為非 CUDA 軟體堆疊提供最佳化的產品。

(首圖來源:Unsplash

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

不是醫生、工程師!全台「1行業」最賺錢 平均月薪飆破7萬元

三立新聞網
02

從破產邊緣到晶片之巔:SK海力士的HBM傳奇與AI時代的逆襲

anue鉅亨網
03

自行車業寒冬,捷安特為何敢開大店?揭開「不只賣車」的逆襲盤算

商周.com
04

中油董座認了!也找聶永真設計新LOGO但考量虧損已暫緩實施

太報
05

獨家》承億創辦人54歲戴俊郎意外辭世 震撼旅宿業

自由電子報
06

台灣普利司通資遣員工551人!公司證實:新竹廠即日起結束營運

工商時報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...