請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

華為挑戰成功?DeepSeek 測試:昇騰 910C 推理性能可達 H100 六成

科技新報

更新於 02月05日10:57 • 發布於 02月05日10:57

華為最新的 AI 處理器「昇騰 910C」(Ascend 910C)號稱表現可媲美 Nvidia H100 GPU。根據 DeepSeek 研究人員的測試,在推理任務中,昇騰 910C 效能可達 H100 的 60%。雖然昇騰 910C 並非當前最強 AI 晶片,但它的推出有助於降低中國對 NVIDIA GPU 的依賴。

微信公眾號 AGIHunt 指出,DeepSeek 團隊的實測數據顯示,華為 910C 處理器的推理效能表現超乎預期。若透過手動優化 CUNN 核心,性能還可進一步提升。此外,DeepSeek 對昇騰處理器的原生支援,以及其 PyTorch 儲存庫可讓 CUDA 到 CUNN 無縫轉換,讓華為硬體更容易整合到 AI 工作流程中。

這顯示儘管受美國政府制裁,及無法獲得台積電的先進製程技術,華為 AI 處理器的能力仍在快速進步。

華為和中芯國際在 2019-2020 年間已成功追上台積電的能力,並生產出可與 A100 和 H100 處理器相媲美的晶片,但昇騰 910C 並非 AI 訓練的最佳選擇,主要仍以 NVIDIA 的 GPU 占據領先地位。

DeepSeek 的 Yuchen Jin 表示,「長週期訓練的穩定性是中國晶片最大難關」。這涉及 NVIDIA 軟硬體生態系統的深度整合,CUDA 護城河已經發展二十多年。雖然推理性能可繼續改善,但持續的訓練工作負載需要華為進一步改進軟硬體堆疊。

昇騰 910C 採用 chiplet 封裝,整合約 530 億個電晶體。過去昇騰 910 運算晶片採用台積電 N7+ 製程,而昇騰910C 運算晶片則由中芯國際採用第二代 7 奈米級(N+2)製程製造。

有專家預測,隨著 AI 模型向「Transformer 架構」(如 GPT、BERT 等)靠攏,CUDA 和 PyTorch 編譯器的重要性將降低。此外,DeepSeek 團隊在軟硬體優化方面的專長,也可能大幅降低對 NVIDIA 的依賴,大幅節省成本。然而,要在全球競爭,中國必須克服長期訓練穩定性的挑戰,進一步完善其人工智慧運算基礎設施。

(首圖來源:華為)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

0 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0