藍色巨人 IBM 於 11 月 18 日發布公告表示,將和處理器大廠 AMD 達成合作,計劃在 IBM Cloud 上部署 AMD Instinct MI300X 晶片以提供服務。此項服務預計將在 2025 年上半年推出,目標是提升企業客戶在生成式 AI 模型和高性能計算(HPC)應用中的性能和能效。
IBM 表示,透過此像雙方合作,其 watsonx AI 與資料平台,以及 Red Hat Enterprise Linu 的 AI 推理,進一步整合支援 MI300X 晶片。未來,IBM Cloud 將提供 AMD Instinct MI300X 晶片運算服務,以支援企業客戶處理計算密集型工作執行。
IBM 進一步強調,MI300X 晶片配備 192GB 高頻寬記憶體(HBM3),能夠支援大型模型的推理和微調,幫助客戶以更少的 GPU 運行更大的模型,降低推理成本。此外,雙方將利用 IBM Cloud 的安全性與合規性能力,以支援各產業的企業客戶,尤其是那些受到嚴格監管的企業。
事實上,目前在資料中心 AI 晶片的使用上,主要仍以 x86 架構為大宗,少部分 Arm 架構處理器之外,IBM 的 POWER 系列也是一小部分。目前,IBM 旗下 AI 伺服器主流是搭載在 2021 年推出的,以三星 7 奈米 EUV 製程所生產的 POWER 10 處理器。根據官方說法,與 Power9 相比,Power10 的核心性能高出 2.5 倍;處理相同工作負載的耗能減少 33%。
雖然,就目前 IBM 搭載 POWER 10 處理器的伺服器來說,搭配 IBM 本身的軟體與網路架構,還可以因應企業客戶的企業級運算需求。然而,如果將工作執行上升到資料中心層面,加上當前 AI 晶片都已經進展到 5、4 奈米,甚至是 3 奈米製程以提升效能的情況下, POWER 10 可能就力不從心。因此,催生了 IBM POWER 11 處理器與 IBM Spyre Accelerator AI 晶片將預計在 2025 年推出的計畫。只是、在此之前,市場預期,IBM 為了滿足當前客戶的需求,也使得 IBM 必須聯手 AMD,在 IBM Cloud 提供 AMD Instinct MI300X 晶片運算服務。
(首圖來源:Flickr/Open Grid Scheduler / Grid Engine CC BY 2.0)
留言 0