請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

記憶體危險了?Cerebras晶圓級AI晶片挑戰HBM壟斷格局

anue鉅亨網

更新於 05月18日06:40 • 發布於 05月18日06:40
圖:Pixabay/Unsplash/Pexel

人工智慧(AI)晶片新創公司 Cerebras (CBRS-US) 於 14 日在那斯達克掛牌上市,首日股價即翻倍,漲幅達 109%,市值一舉突破千億美元。分析指出,市場押注的,是一條與輝達 (NVDA-US) 截然不同的 AI 晶片技術路線,為市場展現 AI 晶片是可以繞開高頻寬記憶體(HBM)的。

Cerebras 的核心產品,是將一整片直徑 12 吋的矽晶圓不切割、不分裂,直接製成單一晶片,稱為晶圓級引擎(WaferScale Engine)。

其最新一代產品 WSE-3 搭載 4 兆個電晶體、90 萬個運算核心,以及 44GB 的片上記憶體(SRAM)。

關鍵在於:這顆晶片完全不使用高頻寬記憶體(HBM)。

這看似一個規格上的細節,卻牽動著整條 AI 硬體供應鏈的利益分配。目前全球 HBM 市場由 SK 海力士、三星、美光科技 (MU-US) 三家寡占。

其中,SK 海力士的 HBM 業務毛利率高達 79%,甚至超過輝達本身,正是因為這類記憶體製造難度極高,且是現行 GPU 架構不可或缺的組件。

HBM vs 晶圓級架構:AI 晶片的兩條路徑

AI 晶片長期面臨所謂「記憶體牆」的瓶頸:運算核心速度遠超過資料傳輸速度,大量時間耗費在等待資料,而非實際運算。

輝達的解法,是把原本分散在系統裡的記憶體搬到 GPU 旁邊,透過 HBM 和先進封裝把距離大幅縮短,從幾十公分壓到毫米級。但本質上,數據仍然需要「跨區搬運」,只是路徑更短了。

Cerebras 的做法則更為激進,直接把整片晶圓做成單一運算晶片,讓數十萬甚至近百萬核心與本地記憶體一一綁定。資料不再需要遠距離調度,而是像隨手可得的工具一樣就在計算單元旁邊,實現真正的就地存取。

這使 Cerebras 在短上下文推理任務上,速度比 GPU 方案快達 15 倍,適合聊天機器人、程式生成、即時翻譯等高頻應用場景。

天花板:上下文長度是罩門

然而,晶圓級架構也有其硬限制。Cerebras 的片上記憶體僅有 44GB,遠不足以容納完整的大型模型參數。

為此,Cerebras 發展出「權重流」(Weight Streaming)技術作為因應,模型參數並不存放於晶片之上,而是置於外部的 MemoryX 伺服器,運算時依需求逐層串流載入,晶片上的空間只用來處理當下正在執行的那一層。

這個機制在短上下文場景下運作良好,但一旦模型需要同時掌握大量上下文,例如分析數百頁文件、處理長篇會議記錄,片上空間就成了無法突破的瓶頸。

Cerebras 目前最高僅支援 128K 的上下文長度,與輝達 B200 可處理的百萬 token 級別相比,差距懸殊。深度分析類任務,目前仍是 HBM 大容量架構的主場。

供應鏈的三層衝擊

分析指出,Cerebras 的技術路線,對記憶體產業鏈構成三個層次的影響。

其一,HBM 需求增量遭分流。 AI 推論市場高速成長,其中短上下文的即時互動需求若大量導入晶圓級方案,對 HBM 的新增需求便會相應減少。

這並非存量替代,而是增量空間被切走一塊。SK 海力士目前訂單積壓逾三年,短期無虞,但兩三年後的新增產能規劃,恐需重新評估。

其二,設計工具與 IP 廠商受惠。 晶圓級設計需要更精密的 SRAM 架構規劃與電子設計自動化(EDA)模擬工具,使受益方從「獨立記憶體製造商」變成了「晶圓廠 + 設計工具商」,因此 Arm(ARM-US) 、新思科技 (SNPS-US) 、Cadence 設計系統 (CDNS-US) 等 IP 與設計工具商,成為這條路線的新受益者。

其三,新興記憶體技術迎來潛在商機。Cerebras 的權重流架構,需要外部記憶體(MemoryX)來存放無法塞進 44GB SRAM 的模型參數,而這類記憶體必須同時具備高頻寬、大容量與低功耗。

目前 DRAM、SSD、HBM 各有缺點,因此 MRAM 與 ReRAM 反而有機會成為折衷方案。它們兼具較快速度、更大容量與非揮發特性,過去始終缺乏大規模商業場景,如今可能因晶圓級引擎而迎來真正落地機會。

若晶圓級架構開始普及,MemoryX 需求可能帶動 MRAM/ReRAM 與新型記憶體產業鏈成形。不過,前提仍是晶圓級晶片本身能成功放量。

Cerebras 的路線,理論上為受 HBM 供應鏈限制的半導體業者提供了另一條出路。

然而,Cerebras 的 WSE-3 採用台積電 (2330-TW) N5 製程,整片晶圓的良率挑戰極為嚴峻,Cerebras 透過 1.5% 核心備援加上軟體容錯機制,才得以將良率拉至可用水準,技術門檻極高,非一蹴可幾。

HBM 壟斷格局鬆動?晶圓級 AI 架構開啟新戰場

Cerebras 全年營收約 51 億美元,與輝達資料中心業務的 1,300 億美元相比,體量懸殊。然而,這家公司的意義,不在於能否取代輝達,而在於它證明了一條在架構層面繞開 HBM 的路確實存在。

分析稱,AI 晶片的利益格局過去只有一張桌子:HBM 加 GPU,由 SK 海力士、三星、台積電、輝達四方分食。

如今,第二張桌子正在成形:晶圓級晶片加 MemoryX,台積電同時吃下製造與片上記憶體兩塊,新興記憶體技術伺機分羹,HBM 廠商的地位暫時穩固,但增量空間已開始縮水。

兩張桌子並陳,哪張將來入座者眾,現在尚無定論。但資本與產業鏈的資金,已悄悄開始向第二張桌子移動。

更多鉅亨報導
台灣、南韓成AI熱潮「主要受益者」!高盛:台積電持續支撐台股表現
AI投資新主線浮現!華爾街押注「光通訊股」接棒記憶體狂潮

點我加鉅亨網LINE好友🔥財經大事不漏接

查看原始文章

更多理財相關文章

01

三星電子驚險達勞資協議 員工最高年領1400萬獎金

中央通訊社
02

台股收漲1347點!改寫史上第五大漲點 台積電收2230元.聯發科漲停

台視
03

黃仁勳坦言「中國市場幾乎讓給華為」 輝達財測已不期待中國貢獻

ETtoday新聞雲
04

又出包!App當機無法下單 台新證券:已恢復正常顯示

CTWANT
05

台股收漲1347點創史上第5大漲點 重返41300點

中央通訊社
06

聯發科出關爆強!開高飆漲停鎖死 排隊買單逾3,600張

經濟日報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...