請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

簡單回顧英特爾最近「有點坎坷」的伺服器 GPU 發展

科技新報

更新於 2023年03月23日09:06 • 發布於 2023年03月23日08:00

競爭激烈的科技業,若不考慮遲遲清不光的庫存,所有置身其中的參賽者,無不竭盡全力、盡其所能儘快推出新產品,落後競爭對手一年半載更是罪大惡極,但各位能夠想像,伺服器專用繪圖處理器(Server GPU)市場,即將上演「三年空窗期」的世界奇觀嗎?

美國時間 3 月 3 日星期五下午,英特爾「加速計算系統和繪圖事業群」(Accelerated Computing Systems and Graphics,AXG)臨時總經理 Jeff McVeigh 公開一封信,簡單介紹英特爾伺服器 GPU 的產品時程表。無獨有偶,3 月 22 日執行長 Pat Gelsinger 宣布首席架構師 Raja Koduri(2017 年 11 月離開 AMD,閃電加入英特爾)3 月底離開英特爾,加入生成式 AI 新創公司,「剛剛好」緊跟著 2022 年底 AXG 事業群重組。

▲ 一圖勝千言,回顧去年的英特爾計畫,現在狀況就是這麼簡單:啊,看到天空了。

簡而言之,英特爾已取消一年半內發表多款伺服器 GPU 產品,包括人工智慧與高效能計算(Data Center GPU Max)的「Rialto Bridge」和雲端遊戲與媒體編碼(Data Center GPU Flex)「Lancaster Sound」規劃,代表英特爾今年到 2025 年不會有新伺服器 GPU 推出。雖然據英特爾長期計畫,仍追求在利潤豐厚的伺服器 GPU 市場,設法從 Nvidia 的蛋糕奪取相當占比,但眼前發展,卻是英特爾放棄兩三年內市場。

至於寄予厚望的「XPU」首發「Falcon Shores」,與 Lancaster Sound 後繼者「Melville Sound」更延期至 2025 年。換言之,英特爾等於變相宣布伺服器 GPU 領域落後 AMD 和 Nvidia 整整三年。更讓人驚訝的是,這顆重磅炸彈一丟下去,連 XPU 也不 XPU 了,從「2024 年 XPU」變成「2025 年 GPU」。

這情境講含蓄點,大概有點像「不必打開窗戶,抬頭就是天空」之感。晴空萬里時非常浪漫,但傾盆大雨就讓人笑不出來。

英特爾不斷腰斬伺服器 GPU 的黑歷史

但回顧英特爾這間公司的伺服器 GPU 發展史──或嚴格說「通用運算 GPU」一直不缺不斷取消產品的黑歷史,像 15 年前「x86 指令集顯示卡」」Larrabee」、2010 年命運多舛最終又始亂終棄的 Xeon Phi 產品線、和第一個被封存(名義上是當作 Aurora 超級電腦和 oneAPI 的開發平台,而不會商品化)的 Xe 繪圖架構「Xe-HP」,都是血跡斑斑的前車之鑑。

▲ 對於英特爾,Larrabee 實在是黑到不能再黑的黑歷史。

因「x86 義和團之亂」橫空出世的 Larrabee 和後代 Xeon Phi,透過硬塞巨量小型 x86 CPU 核心,硬湊出看起來很漂亮的理論浮點運算效能,就傻傻無視許多先天限制,幻想可經純軟體化手段,有效率做到各種功能,失敗一點都不讓人感到一絲一毫意外(至於歌功頌德英特爾的「偉大創意」,倒是不少科技媒體努力躬逢其盛),也使英特爾個砍掉重練,打造橫跨幾乎所有應用領域的 Xe 繪圖架構體系。

但英特爾 2020 年一直努力展示 FP32 輸出量高達 42TFlops 的 Xe-HP,卻在 2021 年整個風雲變色,Xe-HP 取消,將原本偏遊戲應用的 Xe-HPG(Alchemist,後來的 Arc 系列)推向伺服器市場,處理人工智慧推論與雲端遊戲繪圖等更具可擴展性的任務,高效能運算與人工智慧訓練則仰賴 Xe-HPC(Ponte Vecchio),整個產品策略變得「有點像又不太像」名為 Nvidia 的最強對手。

但除非英特爾也讓 Xe-HPG 支援模組化多晶片塊(Tile)結構,否則無法提供 Xe-HP 預定的性能,事後證明這件事也從未發生,真是可喜可賀。

▲ Xe-HP 最重要特色莫過於「積木疊疊樂」,對應不同性能需求,但換成 Xe-HPG 就力有未逮了。

英特爾會這樣決定的理由,最直覺猜測就是「Xe-HP 夾在 Xe-HPC 和 Xe-HPG 中間,不上不下,地位尷尬」,但當各位想起 Xe-HP 是英特爾計劃自行生產的唯一高性能 Xe 繪圖架構晶片(10nm Enhanced Super-Fin,現在 Intel 7 製程),但其他兩款卻都是台積電 6 奈米(N6),也許大家心裡就會推論出自己的答案了,一切盡在不言中。

▲ 看到 Xe-HP 是「純英特爾製造」,再回想英特爾當時景況,很多人心裡大概就有底了。

當 XPU 不再 XPU:減少記憶體搬移對改善「能耗比」很重要

將往事拋諸腦後,聚焦 2025 年的「救世主」、下一個 Max 系列:「Falcon Shores」吧,會赫然發現:這不再是英特爾 2022 年概述的「具備同時封裝 CPU 和 GPU 彈性」的 XPU,而更像「傳統」GPU。Falcon Shores 將提供不同 IP 區塊選項,為 XPU 的一部分,但也不是 2025 年登場的這代。

▲ 英特爾 XPU,看來還要等很久,如果沒出意外。

為何讓 CPU 和 GPU 共享記憶體,現在會變得那麼重要,原因不外乎減少兩者間移動和複製資料浪費的功耗,讓 CPU 和 GPU 更快速容易傳遞資料。大型高效能運算系統,光運算節點內部和外部移動資料,就會消耗大量電力。因此採用更先進技術,共同封裝 CPU、GPU、加速器和記憶體,視為「不同於傳統獨立組件的功率曲線」提高互連速度的方法,並允許更多功耗預算去計算,而不是搬移資料。

▲ 這看似簡單的道理,AMD 卻佈局超過十年。

如果腦袋還是轉不過來,就想想蘋果 M1 / M2 可怕的能耗比就知道了,充分對世人展示了「整合」的威力。

▲ 靠越近走越快,且還更省電,蘋果 M1 / M2 就是最好示範。

反觀 2023 年,AMD Instinct MI300 與 Nvidia Grace Hopper,卻都是 CPU、GPU 和記憶體高度封裝在一起的產物。即使 Nvidia Grace Hopper,本質上是在主機板上擺兩個緊密耦合的晶片,而不像 AMD 默默努力多年的 EHP(Exascale Heterogenous Processor)大玩 3D 堆疊,但依然領先英特爾時下水準。

更何況 2025 年前,無論 AMD 還是 Nvidia,MI300 和 Grace Hopper 的繼承者,幾乎肯定會在 Falcon Shores 上市前浮上水面,英特爾依舊會承擔「產品還沒上陣就變落伍」的潛在風險──意味 2026 年前,AMD 和 Nvidia 下一代架構仍處於領先地位。

也許 oneAPI 和個人電腦市場才是英特爾的救贖

到頭來視為「英特爾的 XPU 野心擴張計畫」的 oneAPI,企圖讓開發者通吃 CPU、GPU、FPGA 甚至 ASIC,打造最符合應用程式需求的任何運算架構,最終成功才是屬於英特爾的救贖,尤其當英特爾極可能需要三年內,完全仰賴仍處於市占率優勢的 CPU 和必須「苦撐三年」的現有 GPU 產品線,來守住伺服器市場陣地。

▲「突破 Nvidia CUDA 封鎖網」不是簡單的事。

此外,即便從 AMD 挖角一堆人,總算勉強弄起來的 Xe 繪圖架構體系,從遊戲到資料中心,一路跌跌撞撞,最起碼證實足堪大任,但英特爾能否建立起穩固的 GPU 基本盤,最終還是得仰仗消費市場把「量」做起來,特別是高階顯卡。

Nvidia 和 AMD 已耗費近17年時間,證明這條硬道理(x86 CPU 的伺服器霸權之路也是奠基於巨大的個人電腦市場之上)。或許關心英特爾伺服器戰線,並早就習慣其靠 CPU 內顯躺著吃掉大半市占率之餘,也值得多多觀察身邊是否出現越來越多「Intel Inside」獨顯,搞不好數量已多到超出各位預期。

(首圖來源:shutterstock)

0 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0