在 Computex 2024 期間,Arm CEO Rene Haas 特別說明了 AI 所帶來產業變革,並且再次說明了 Arm KleidiAI,包括針對 AI 工作負載的 KleidiAI 和針對電腦視覺應用的 KleidiCV。另外也再次針對 Arm 終端產品運算子系統(CSS)做了說明,並且提到預計 2025 年底,市場將有超過千億的 AI 裝置採用 Arm 的產品組合。
眾所皆知愛台灣的 NVIDIA 執行長黃仁勳這次訪台最常逛的就是夜市,首場 Keynote 似乎也吸引許多 CEO 級人物關注,AMD CEO 蘇姿丰在活動上以「夜市」為例大秀 AI,而 Arm CEO Rene Haas 也在 Keynote 上直接拿他在發表會前一天逛夜市的照片做對比,提到自己也試著去逛了一下夜市,並且強調台灣的 OEM 與 ODM 廠商都是Arm的重要合作夥伴。
Rene Haas 表示,自 1981 年以來,網路以驚人的速度發展,然而 AI 的發展是經過一段時間累積而爆發的,它以應用程式為例,Twitter 花了五年普及、Instagram 約兩年半、TikTok 僅需 9 個月,然而 ChatGPT 則只需要兩個月。在未來,AI 的普及需要效能、需要更多廠商加入。
談到效能,Rene Haas 提到亞馬遜最新的雲端處理器 AWS Graviton 效能提升 60%、微軟 Azure Cobalt 100效能提升 40%、Google Axion 效能提升 60%、NVIDIA 昨晚發表的 Grace Blackwell 效能提升 25X,說明效能對於 AI 的影響。他也提到近期發表的 Arm KleidiAI 將提供開發人員無縫存取Arm CPU 上的最佳效能。
KleidiAI 是一組為 AI 框架開發人員設計的運算核心,使他們能夠無縫存取 Arm CPU 上的最佳效能,適用於各種裝置,並支援 NEON、SVE2 和 SME2 等關鍵 Arm 架構特性。KleidiAI 與現行熱門的 AI 框架整合,例如 PyTorch、TensorFlow 和 MediaPipe,以促進主要模型包括 Meta Llama 3 和 Phi-3 的加速。Haas 表示:「在 Arm 超過 30 年的歷史中,如果我們有學到什麼,那就是無論硬體多出色,如果沒有開發人員能夠存取的資源,那硬體也沒有多大用處。」
Arm 的資深副總裁暨終端產品事業部總經理 Chris Bergey ,也在會中介紹了最近發表的 Arm 終端產品運算子系統(CSS)。這是 Arm 第一次在先進的 3 奈米製程節點中,導入其 CPU 和 GPU 的實體實作。 Bergey 表示,這一點非常重要,因為 Arm 生態系現在可以在這些先進的 3 奈米製程節點中,採用經過驗證的核心實體實作,能以更充分的信心更快地上市。
Arm 終端產品運算子系統 (CSS) 是全新的運算解決方案,結合 Armv9 的各項優勢,以及通過 3nm 製程節點驗證及認證可量產實作的全新 Arm CPU 及 GPU,結合 Kleidi 軟體,將成為推動 AI 未來發展的運算平台。
Arm 還展示同樣採用台積電 3nm 製程的 CPU Cortex-X925 及 GPU Immortalis-G925 的設計,提供片段預處理技術 (Fragment prepass) ,並將圖塊模組和移位轉換單元的數據傳輸量提高到原來的兩倍,採用最新的圖形及機器學習 (ML) 效能與節能技術,圖塊模組資料傳輸量提升兩倍,移位轉換單元的資料傳輸量提升兩倍,GPU效能是歷代最強,相較上一代效能提升 37%、AI 處理提升 34%、光追效能提升 52%。Arm 資深副總裁暨終端產品事業部總經理Chris Bergey 指出,Arm Immortalis-G925 GPU 是Arm 目前為止效能及效率最高的GPU。
根據 Arm 介紹,Immortalis-G925 是以 Arm 第 5 代架構為基礎,可配置最多 24 個核心,搭載了兩組Cortex-X925、四組Cortex-A725以及兩組Cortex-A520,是所謂四大兩小以及兩超大核心的組合,整個平台組合專為AI PC設計,效能提升 37%,GPU 能耗提升 30%,AI 處理效率大幅提升 59%, 是 Arm 有史以來為 Android 平台開發的最強效能核心,也為次世代 AI PC 帶來可擴充性。
順帶一提,Cortex-X925 核心單執行緒應用執行速度比前代改良 36%,而執行 AI 應用效能也高 41%,以 Cortex-X925 為基礎的新 CPU 每核心 L2 快取可高達 3 megabytes。根據先前發表會介紹,此次與 X925 同步發表的還有 Cortex-A725 和 Cortex-A520,前者效能相比前一代產品提升了 35%,而後者主要專注在能耗。在遊戲性能方面,ARM 的改進使得相同水準的遊戲效能下,功耗降低了 30%。
談到 AI 應用,Haas 指出,Arm 已經成為全球每個主要作業系統的既定標準。Microsoft 宣佈的 AI PC 就是其中一個很好的例子,所有最常用的應用程式,現在都在 Windows on Arm 上原生運行。事實上,擁有 1800 萬軟體開發人員的生態系,使得今天有更多的開發人員在 Arm CPU 上設計,而不是任何其他處理器。如果我們希望能從邊緣的最小裝置到雲端的訓練和推論,體驗 AI 帶來的社會變革,這種對開發人員的支持是極其重要的。開發人員需要能夠將他們在 AI 上的創新應用於硬體,並在效能優化、功耗最佳化、高度可執行和可預測的狀態下運行。
Haas 在演說結束時進一步強調了 Arm 對 AI 的承諾:提供地球上最完整的運算平台。透過例如Arm CSS 和 KleidiAI 這樣的創新,他預計到 2025 年底,將有超過 1000 億台 Arm 裝置可以運行AI。Haas 表示,這不僅將重塑產業,也將重塑整個地球。
留言 0