請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

華為挑戰成功?DeepSeek 測試:昇騰 910C 推理性能可達 H100 六成

科技新報

更新於 2025年02月05日10:57 • 發布於 2025年02月05日10:57

華為最新的 AI 處理器「昇騰 910C」(Ascend 910C)號稱表現可媲美 Nvidia H100 GPU。根據 DeepSeek 研究人員的測試,在推理任務中,昇騰 910C 效能可達 H100 的 60%。雖然昇騰 910C 並非當前最強 AI 晶片,但它的推出有助於降低中國對 NVIDIA GPU 的依賴。

微信公眾號 AGIHunt 指出,DeepSeek 團隊的實測數據顯示,華為 910C 處理器的推理效能表現超乎預期。若透過手動優化 CUNN 核心,性能還可進一步提升。此外,DeepSeek 對昇騰處理器的原生支援,以及其 PyTorch 儲存庫可讓 CUDA 到 CUNN 無縫轉換,讓華為硬體更容易整合到 AI 工作流程中。

這顯示儘管受美國政府制裁,及無法獲得台積電的先進製程技術,華為 AI 處理器的能力仍在快速進步。

華為和中芯國際在 2019-2020 年間已成功追上台積電的能力,並生產出可與 A100 和 H100 處理器相媲美的晶片,但昇騰 910C 並非 AI 訓練的最佳選擇,主要仍以 NVIDIA 的 GPU 占據領先地位。

DeepSeek 的 Yuchen Jin 表示,「長週期訓練的穩定性是中國晶片最大難關」。這涉及 NVIDIA 軟硬體生態系統的深度整合,CUDA 護城河已經發展二十多年。雖然推理性能可繼續改善,但持續的訓練工作負載需要華為進一步改進軟硬體堆疊。

昇騰 910C 採用 chiplet 封裝,整合約 530 億個電晶體。過去昇騰 910 運算晶片採用台積電 N7+ 製程,而昇騰910C 運算晶片則由中芯國際採用第二代 7 奈米級(N+2)製程製造。

有專家預測,隨著 AI 模型向「Transformer 架構」(如 GPT、BERT 等)靠攏,CUDA 和 PyTorch 編譯器的重要性將降低。此外,DeepSeek 團隊在軟硬體優化方面的專長,也可能大幅降低對 NVIDIA 的依賴,大幅節省成本。然而,要在全球競爭,中國必須克服長期訓練穩定性的挑戰,進一步完善其人工智慧運算基礎設施。

(首圖來源:華為)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

記憶體價格失控又一受害者 GoPro首度示警無法持續經營

anue鉅亨網
02

快訊/百萬國民高息ETF 00919成分股調整出爐!18進18出

太報
03

黃仁勳親為Arm站台 執行長曝「14年前青澀合照」

台視
04

狂砸3137億!巴菲特「爆買這檔AI巨頭」持股衝破1兆 震撼華爾街

三立新聞網
05

文組也能進輝達!1職缺年薪最高649萬、可遠距上班 應徵條件曝光

華視新聞
06

英特爾陳立武也感謝台灣,回顧 40 年前應李國鼎之邀參與矽島繁榮發展

科技新報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

留言 1

留言功能已停止提供服務。試試全新的「引用」功能來留下你的想法。

Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...