請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

華為昇騰晶片整合 DeepSeek 推一體機,效能最高約 H100 七成強攻中國市場

科技新報

更新於 2025年04月29日09:57 • 發布於 2025年04月29日08:50

美中貿易戰,美國對中國人工智慧 (AI) 晶片出口管制越嚴格,日前甚至傳出川普政府也要管制降規版 H20 晶片出口,讓製造商輝達 (NVIDIA) 提列 55 億美元庫存損失。但中國 AI 市場需求依舊強烈,華為積極推出昇騰 (Ascend) 系列晶片填補市場空缺,最近出現華為昇騰系列晶片與 DeepSeek 模型結合的一體機分析文,市場可一窺性能與跟主流產品的差異。

昇騰系列晶片與 DeepSeek 模型結合的一體機,昇騰 910B 晶片採 7 奈米,FP16 算力為 280TFLOPS,INT8 算力到 140TOPS。昇騰 910C 採中芯國際 (SMIC) N+2 製程,FP16 算力約 320TFLOPS,約能碰到輝達 H100 的 60%~70% 性能。

一體機架構以分散式設計為主。晶片由昇騰 910B 或 910C 搭配鯤鵬 920 CPU。記憶體為 NVMe SSD,單機容量可達 16TB。外部連結傳輸的網路架構,藉 200Gbps 頻寬 RoCE v2 支援大規模叢集。RoCE 網路能在非均勻 Bruck 演算法設計下,使叢集通訊效率提升 50%,網路成本占比降至 20% 以下。

除了硬體架構,一體機 MindSpore 框架協助模型訓練和和進行設備的微調。CANN 軟體棧最佳化讓推理效率提升 30%。而 CANN 支援 ACL 介面,開發者也可以藉此來自訂高性能算子,針對特定產業的需求進行運作。而支援多卡平行的情況下,藉由 HCCL 庫來達到高效通訊的目的。

文章列出價格,32B 版約 30 萬至 50 萬人民幣,671B 版 300 萬至 500 萬元。訓練與推理整合一體機,以 200 萬人民幣計算,高階產品可能超過 1,000 萬人民幣,較輝達約 2,000 萬人民幣 H100 解決方案,成本降了 60%~70%。

服務處理的 API 定價,DeepSeek-V3 輸入每百萬 token 為 1 人民幣,R1 輸出每百萬 token 為 16 人民幣,遠低於 OpenAI。成本優勢加上中國市場對 AI 算力需求孔急,應會推出免費版,吸引中小企業試用。

(首圖來源:華為)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

房市好怪/養蚊屋飆10.43%創近15年新高 20坪以下小宅最糟糕幾乎是平均兩倍

鏡報
02

晶睿3/27正式下市、3/18最後交易日 將成台達電100%子公司

anue鉅亨網
03

張榮發遺產10年漲5倍!張國煒現金股利649億進帳

民視新聞網
04

美關稅變局 鄭麗君:台美MOU關稅優惠待遇不變 我握1735項協定基礎

上報
05

房市好怪/新成屋空屋率正在下降 舊屋掛牌卻賣不太動養蚊率狂

鏡報
06

川普警告各國別耍手段 否則祭出更高關稅!WSJ:擬對6大產業課「國安稅」

太報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

留言 1

留言功能已停止提供服務。試試全新的「引用」功能來留下你的想法。

Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...