代理式 AI 推升 4 倍 CPU 需求!Arm 打破 35 年傳統首推自研晶片,直攻兆元 AI 商機
「我們現在進入了一個全新的 Arm 時代,我們將直接供應 CPU 實體晶片,這麼做的最大原因,是因為合作夥伴提出了要求,同時也是為了解決當代理式 AI 成為主流時,所有工作負載都受限於 CPU 瓶頸的問題,」 Arm 在今(3/25)舉行的 Arm Everywhere 大會上,由執行長 Rene Haas 宣布一項具備歷史意義的重大戰略轉型:Arm 將打破過去 35 年來僅授權 IP 與架構的傳統,首度推出親自打造且量產就緒的實體 CPU 晶片——「Arm AGI CPU」。
隨著「代理式 AI」(Agentic AI)爆發性成長,全球資料中心正迎來前所未有的運算與能源瓶頸。為了解決這項挑戰,Rene Haas 不僅點出 AI 時代底層基礎架構的巨變,Arm 更邀請科技巨頭 Meta 與 OpenAI 同台,揭示算力與能源效率的戰爭,將如何決定人類 AI 發展的未來。
代理式 AI 引發資料中心「壅塞」,Arm 轉型直攻實體晶片
「昂貴的加速器負責生成 Token,就像砂石車倒下大量的泥土,但總得有人把這些泥土搬走,CPU 就是負責搬運這些泥土的機具,」Rene Haas 生動比喻當前 AI 基礎架構的分工與困境。他進一步解釋,AI 代理與過去單純的問答不同,它們能全年無休地處理複雜的非同步工作流程,這些全都是 CPU 的工作,也讓平均每個人類消耗的 Token 數量暴增 15 倍以上,使得大量請求湧入雲端,導致資料中心正面臨嚴重的效能壅塞(Choking)。
為了應付龐大資料流帶來的調度與排程,資料中心對 CPU 的需求急遽攀升。Rene Haas 點出具體數據:過去在 AI 資料中心裡,每 10 億瓦(gigawatt)的電力大約對應 3,000 萬個 CPU 核心,但在代理式 AI 時代,CPU 需求將飆升 4 倍,達到每 10 億瓦高達 1.2 億個 CPU 核心。
然而,電力與資本在資料中心裡都極為珍貴。面對「在相同功耗限制下,必須塞入 4 倍 CPU 核心」的極端挑戰,Arm 決定打破傳統,親自下場研發實體晶片。Rene Haas 強調,直接供應實體 CPU 的首要原因雖然是順應合作夥伴的要求,但更核心的目的,是為了解決當代理式 AI 成為主流時,所有工作負載都受限於 CPU 瓶頸的問題。
打破傳統 x86 限制,Arm 揭開 AGI CPU 的效能與擴展模式
Arm 雲端 AI 事業部執行副總裁 Mohamed Awad 進一步為 Arm AGI CPU 的技術優勢定調。他強調,這款晶片是從零開始專為 AI 資料中心打造,其「超能力」在於效能(Performance)、擴展性(Scale)與能源效率(Efficiency)三大核心。
Mohamed Awad 直言,傳統 x86 架構背負太多過往的執行負擔與舊有功能支援。此外,傳統架構過度依賴「多執行緒(Multi-threading)」來應付多任務,卻沒有相應加倍 I/O 與記憶體頻寬,導致效能折損,最終迫使資料中心營運商必須超額配置至少 30% 的硬體來彌補缺陷。
相較之下,Arm AGI CPU 選擇放棄多執行緒,為每個單一執行緒的核心提供專屬且高達 6 GB/s 的記憶體頻寬,確保效能得以線性擴展。「我們沒有浪費的運算週期、沒有被閒置的算力,也沒有白白消耗的電力,這是一款殺手級產品,它將對 AI 資料中心帶來極為深遠的影響,」Mohamed Awad 說。
Meta、OpenAI 與 Arm 聯手,克服算力與效能的雙重挑戰
在代理式 AI 的推波助瀾下,超大規模資料中心正面臨殘酷現實。作為 Arm 最密切的合作夥伴之一,Meta 基礎架構負責人 Santosh Janardhan 透露,Meta 旗下應用程式每天有約 35 億用戶登入,為了實現為每一位用戶提供「個人超級人工智慧(Personal Super Intelligence)」的願景,旗下名為「普羅米修斯」(Prometheus) 計畫的 AI 叢集在今年底耗電量將突破 10 億瓦,未來甚至將擴張至 50 億瓦。面對如此龐大的指數級擴張,Santosh Janardhan 強調,透過與 Arm 的合作,Meta 得以顯著提升資料中心的效能密度,讓基礎架構轉變為「科技創新的賦能者」。
同樣面對算力與能源的極限挑戰,身處 AI 技術最前線的 OpenAI 也深具同感。OpenAI 科學副總裁 Kevin Weil 指出,在代理式 AI 時代,CPU 在執行容器內工具或 Python 腳本時佔據核心地位。面對內部與客戶對算力無止境的渴望,Kevin Weil 深刻點出 Arm 高能效 CPU 的戰略意義:「如果你有一顆耗電量更少,但效能同樣強大的 CPU,這意味著你可以把省下來的電力用在其他地方,這代表更多的推論、更多的運算,以及更多的智慧。」
為次世代 AI 原生資料中心奠定兆元基石
針對未來的市場機遇,Arm 執行長 Rene Haas 強調,這次轉型不只是單一產品的變革,更是 Arm 與客戶投入的「多世代承諾」(multigenerational engagements),未來 Arm 也將持續推進 AGI CPU3 等後續產品,並同步發展運算子系統(CSS)業務以加速客戶上市。
Rene Haas 指出,直接供應實體 CPU 將徹底改變 Arm 的市場機遇:憑藉從邊緣運算到雲端、從毫瓦(milliwatts)到十億瓦(gigawatts)的全面技術佈局,Arm 預估這將帶來超過 1 兆美元的龐大市場機會。在 Meta 與 OpenAI 等巨頭的推波助瀾下,這款打破 Arm 35 年傳統的實體晶片,正準備重新定義 AI 原生資料中心的架構,為代理式 AI 時代提供嶄新的運算基礎。
*首圖來源:Arm