因「樹大招風」、「雄才大略」與諸多「天災」(天才造成的災難),過去數十年,身為世界最具代表性、長期統治伺服器和個人電腦市場的半導體廠商,英特爾歷史挫敗和錯誤,總是吸引無數看好戲目光,亦不乏出於自家人的嚴厲批判(如現任執行長 Pat Gelsinger 列舉的「三大失敗」),讓惟恐天下不亂的各路媒體與吃飽閒閒看人不爽的科技黑粉,永遠不缺借題發揮的素材和茶餘飯後話題。
但話說回來,難道英特爾的競爭者,就沒有值得回頭探討的「豐功偉業」嗎?
AMD 過往也很精彩
尤其近年「重返農藥(榮耀)」的最直接對手:AMD,創立 1969 年至今,也有超過半世紀的漫長歷史,特別當 AMD 在 1990 年代放棄 Am29000 RISC 處理器(1995 年),集中火力與英特爾 x86 處理器市場相互競爭,剝離龐大成功的快閃記憶體業務(2003 年),併購 ATi 取得繪圖產品線與技術(2006 年),宣佈拆分製造事業單元轉型成無晶圓廠晶片設計公司(2008 年),再一路挺過黑暗十年(2009~2018 年),直到市值超越英特爾,漫長過程也不乏讓人「津津樂道」的往事。
2014 年接下 AMD 第五任執行長的蘇姿丰(Lisa Su),有別於砲火四射且槍口向內的 Pat Gelsinger,上任近十年並未公開批評過 AMD 犯了什麼錯,但筆者前文〈檢視 Pat Gelsinger 提的英特爾「三大失敗」〉,以親身經歷和個人觀點,分享「錯誤」和「失敗」的看法,這次再度野人獻曝,回顧 AMD 近 20 年幾個坊間口耳相傳、約定俗成的「重大失敗」,並分享筆者觀察到的脈絡。
遲遲未見蹤影的 K8 正統繼承者
雖然 AMD CPU 從 2017 年為起點,藉由全新 Zen 微架構,重回與英特爾競爭擂台,但 AMD 優勢主要來自 Chiplet 策略的壓倒性核心數量,與台積電先進製程的低功耗,論單一核心性能,對上英特爾 P-Core 卻占不到多少便宜。論「海放」英特爾的程度,遠遠不及 AMD CPU 全盛時期:K8。經歷過那段歲月的讀者,應該不會忘記 NetBurst 微架構 Xeon 和 Pentium 4 怎樣被 K8 體系 Opteron 與 Athlon 64「花式痛宰」的盛況。
▲ 重新打造的 Zen 微架構是 AMD 從「走音工地秀」谷底爬起來的開始,沒有之一。
提醒「K」的由來:一種說法源於「Killer」,第一個要「獵殺」的對象當然是英特爾初代 Pentium,另一種則代表「Kryptonite」,能殺死超人的元素,AMD 想「殺掉」英特爾。研發進度一再延宕的 K5 可謂出師不利,併購 NexGen 取得的 K6 讓 AMD 有跟英特爾對打的底氣,DEC Alpha 部分團員打造的 K7 則讓 AMD 有本事推出超過英特爾的設計。
▲「推土機」(Bulldozer)是 K11 首發,構想來由受 Fusion 極大影響,結果讓 AMD 賠上伺服器市占率。
但我們熟知的 K8,並非 AMD 原始構想的 K8,反而是以 K7 為基礎的 64 位元衍生物。資料與專利顯示,AMD K8 有兩個原案:K8-1 是後來 K11(推土機) 雙核心叢集多執行緒雛型,「處理俠遊俠」Jim Keller 參與過的 K8-2 追加類似英特爾 NetBurst 的微指令快取(Trace Cache,存著照分支預測的實際指令執行序列) 與以兩倍時脈運行的執行單元。
▲ AMD 在 2003 年秋季微處理器論壇透露的「K8 後繼者」,最後沒有任何影子。
原本 AMD K7 研發團隊 2001 年初開始 K9 專案,看起來跟 K8-2 很像同個東西,有貨真價實 Trace Cache 與每個時脈派發八個巨集微指令(Mop,Macro-op) 的執行寬度,不過經六個月概念驗證後就取消,外界謠傳是 K9 英文發音為 Canine(犬類),太負面所以跳過,但看似激進的 K8-2 也從未現身世人眼前。日後原生四核心與原生六核心的 K10(早期誤傳是 K8L,實為 K8 低功耗版,也就是 Turion 64),也是基於 K8 改良的產物。
換言之,AMD x86 處理器微架構,從 K7 就遲遲未有大進展。AMD 曾 2003 年揭露「K8 正統後繼者」樣貌,含多執行緒、「10GHz 運算」和更強大超純量非循序執行核心等,統統跳票,姍姍來遲慘遭英特爾「鐘擺」(Tick-Tock)產品更新節奏屠殺的 K11,論技術更是明顯退步。當年參與 K8 與 x86-64 指令集的相關人士透露消息,Zen 才是貨真價實的 K10,卻遲到超過十年。
▲ AMD 當初挖角(?)IBM Power4 首席工程師 Chuck Moore,開發「號稱只增加 50% 晶粒面積,即可提升 80% 輸出率」的叢集多執行緒(CMT,Cluster-based Multi-Threading),事後證明是災難一場。
AMD 變來變去的過程,也足以證實要研發高效能 x86 處理器多麼困難,假若英特爾 10 奈米製程沒有慘遭滑鐵盧而失去領先地位,AMD 現在能否如此風光,恐怕是個大問號。
2006 年夏天驚天動地的 ATi 併購案
當筆者問 ChatGPT「請陳述 AMD 歷史犯過的重大戰略錯誤」,第一個跑出來的答案依然是「2006 年以 54 億美元(43 億美元現金+5,800 萬 AMD 股票)收購 ATI Technologies」。
那年夏天這件震驚業界的併購案,讓 AMD 向摩根史坦利貸款 25 億美元,造成 AMD 莫大財務負擔,也促成 2008 年切割製造部門的重大決定(重申這件事跟蘇姿丰一點關係都沒有,她 2012 年才加入 AMD)。如果沒有併購 ATi,搞不好現在 AMD(假設有活下來)也會面臨製程與英特爾陷入同樣困境。
▲ AMD 2006 年耗費 54 億美元巨資,硬著頭皮吃下 ATi,寄望處理器整合 ATi 繪圖技術,建立對抗英特爾和 Nvidia 的不毀防線。
為何 AMD 願意硬著頭皮巨資買下 ATi?就當時背景,AMD 即將面對英特爾重整產品線、集中資源於高能效 x86 處理器的「帝國大反擊」,靠 K8 占到的便宜很可能即將不保,融合 ATi 繪圖有助建立不對稱優勢。再來,AMD 亟欲擴展日韓市場,ATi 日本和韓國客戶、零售通路和代理商網路,剛好是 AMD 想要的重要資產,AMD 進軍行動運算市場與消費性電子的企圖,更讓 ATi 更不可或缺。
▲ AMD 併購 ATi 頗讓眾人意外,因考量技術互補性,英特爾吞掉 ATi、AMD 吃掉 NVIDIA,是外界較「看好」的結果。值得一提,Nvidia 市值當時就有 100 億美元。
話說回來,有鑑於英特爾系統匯流排授權一向是牽制潛在競爭者的好路障,那時 Nvidia nForce 一直是 AMD 處理器的最佳盆友,輿論風向也偏「英特爾吃 ATi,AMD 跟 Nvidia」,但 AMD 併購 ATi、擺明自己統統吃下 AMD 個人電腦系統晶片組業務,也注定與 Nvidia 漸行漸遠,對 AMD 的產品競爭力也造成不小傷害。
恰巧 2006 年底,Nvidia 發表革命性、有統一著色器架構(Unifide Shader)的 GeForce 8 系列繪圖晶片,2007 年 6 月首次公布 CUDA(Compute Unified Device Architecture),踏出 GPU 通用運算的第一步,更奠定今日 Nvidia 驚人市值和人工智慧領域支配性地位的基礎。回首這段歷史,恐怕無人能預期黃仁勳榮登「AI 教父」的現在。「歷史總比小說更離奇」大概就在描述這種奇蹟中的奇蹟。
那 AMD 2022 年初,以近十倍「500 億美元」收購 FPGA 龍頭賽靈思,就不會重蹈覆轍嗎?但相較偏向鞏固消費市場地位的 2006 年,AMD 這次不僅聚焦高獲利的資料中心,且以全股票交易完成收購案,可謂截然不同。兩者唯一可能相似之處,在 AMD 也很想要賽靈思的客戶和業務觸角吧。
對 Fusion 的執念引發一連串亂局
AMD 既有無法拒絕的理由非得硬吃 ATi 不可,就應當盡其所能發揮價值,但產品規劃卻又備多力分(如同步發展大核「推土機」和小核「山貓」),缺乏使命必達的執行力推動「Fusion」大戰略,產品時程一再延宕,眾人期待已久的初代 APU Llano 拖到 2011 年中期才上市,早就失去競爭優勢,不但得花大錢打消上億美元呆滯庫存,且還花 2,950 萬美元賠償投資人損失。
▲ AMD CPU 走上雙軌路線也是必然結果:高性能推土機(Bulldozer) 與低功耗山貓(Bobcat)。但兩者原排定 2009 年登場,卻一起跳票,整整延誤兩年。
對 AMD 來說,寄望 GPU 能截長補短 CPU 的執念,也催生 AMD 接連數年,CPU 和 GPU 分別被英特爾和 Nvidia 壓著當沙包打的發展方向:「超多簡單整數核心」推土機(K11) 與「過度偏通用運算」GCN(Graphic Core Next)。前者讓 AMD 最仰賴的獲利來源「伺服器市場」迅速徹底崩盤,到 2017 年才漸有起色,後者則在 2012 年被 Nvidia 打到一蹶不振,到現在都未恢復元氣。
▲ AMD 2013 年宣傳 hUMA(Heterogeneous UMA)可說是 AMD APU 的完美型態,「人工智慧 APU」Instinct MI300A 極可能是第一個成果。
AMD 2012 年將 Fusion System Architecture(FSA)改名為 Heterogeneous Systems Architecture(HSA),試圖讓 CPU 和 GPU 可共用所有實體記憶體位址和虛擬記憶體空間,兩者互通有無,只為了追求「CPU 和 GPU 共用的勝利」,建構出一道可同時抵禦英特爾和 Nvidia 的護城河。
▲ AMD 2012 年公佈 HSA,讓 GPU 透過 HSA MMU(記憶體管理單元)存取整個系統記憶體,並結合 OpenCL 2.0 共享虛擬記憶體,讓 CPU 和 GPU 共用實體記憶體和虛擬記憶體空間,位址指標(Pointer)能在 CPU 和 GPU 間傳遞,實現所謂「Zero Copy」(零拷貝)。
但關鍵在於,需要整個軟體生態系統配合,不是 AMD 自己說了算。退一萬步講,就算今天昔日 AMD「擘畫」遠景依然未成現實,距「CPU 與 GPU 水乳交融」依舊非常遙遠。
玩半套的 ARM 伺服器策略
AMD 21 世紀初期站穩伺服器市場後,就一再被 ARM 找上門,希望攜手合作(或說搭順風車)進軍這塊利潤豐厚的領域。十年過去了,AMD 被英特爾逐出「傳統」x86 伺服器市場,標準 Opteron 處理器其實 2012 年底成為絕響,想反攻,反而促進兩家公司一拍即合,成長快速的「電信商導向」雲端資料中心和「高能效能比」微伺服器(Micro Server)成為垂涎三尺的肥肉,並樂觀預測微伺服器數年後將占 20% 市場,但終究事與願違,這塊最終仍是英特爾 Atom 與 Xeon-D 平台的天下。
▲ AMD K11 微架構 Opteron 只走到第二代 Piledriver 就中止。
前期布局,AMD「為經營雲端資料中心客戶,提供革命性的創新伺服器技術(disruptive server technology)」,2012 年初以 3.34 億美元(2.81 億美元以現金支付,與 2006 年硬買 ATi 如出一轍)併購 SeaMicro 這間「專門生產低耗能、高頻寬微伺服器的領導廠商」。但到 2014 年,AMD 只拿到 Verizon 一家大單,營收目標達成率不到 60%。
同時,微伺服器也需高能效的新一代伺服器處理器,但那時 AMD 手上僅有「山貓」家族的 BGA 封裝低核心數 Opteron。AMD 取得 ARM 指令集與核心授權,開始研發八核心 Cortex-A57 的 Opteron(代號 Seattle),並 2014 年 5 月財務分析師大會公佈採自主 ARM 微架構、與同期 AMD x86 處理器共用腳位的 K12 與 SkyBridge 計畫,分別開發腳位相容、20 奈米製程、兼具 x86 與 ARM 版的 APU 和系統單晶片。
▲ 2011 年初,領導 K7 發展的執行長 Dirk Meyer 因「無法滿足 AMD 董事會對行動運算市場的期望」黯然結束短短三年任期,新執行長 Rory Read 立即把腦袋動到 ARM 頭上,企圖推動 x86 與 ARM 融合,但一切都停在 PPT,沒有成為現實。
但弄了很久,AMD「總算」2016 年初推出原定 2014 年就要登場的 Seattle,晚了整整兩年,早就失去先機,和英特爾 Atom 體系處理器與 Xeon-D 相比,不但功耗更高(落後的 28 奈米製程)、性能毫無優勢,作業系統和應用環境支援性更是五窮六絕。AMD 首款基於 ARMv8-A(AArch64)64 位元指令集架構的 K12 微架構,於負責專案的 AMD 首席架構師 Jim Keller 跳槽至特斯拉後,也遭取消。
▲ AMD 做出讓人很無言的 ARM 版 Opteron,對上英特爾 Atom 和 Xeon-D,沒有任何競爭優勢。
蘇姿丰 2014 年 7 月升任執行長後,AMD 很快放棄 ARM 處理器和微伺服器,看似天馬行空的 K12 與 SkyBridge 也於 2015 年後 AMD PPT 消失,集中資源給 Zen 微架構與統合 AMD IP 區塊控制法的 Infinity Fabrics,點燃 AMD 2017 年展開空前大反攻的狼煙,才能看到現在市值超越英特爾的 AMD。
放棄 K12 是否真的很不堪
Jim Keller 2022 年 6 月印度「Future of Compute」論壇,吐槽 AMD 在他離職後砍掉 K12 計畫是「愚蠢地取消」,並指責 AMD 害怕改變。如果 K12 有幸延續至今,就可同時應用高能效服務,如計算密集型伺服器、各類嵌入式應用和半客製化(替雲端巨頭客製處理器)等細分市場。
▲ 如據 Jim Keller 描述,K12 最終成品應就是 ARM 版 Zen 架構。
但歷史沒有如果,照 AMD 多次亂開戰線分散資源的前車之鑑,AMD 維持 K12 的後果,極可能仍是兩頭皆空。事後諸葛之言,AMD Zen 4c 在 128 核心的「雲端原生」EPYC(代號 Bergamo)已證明非常成功,斤斤計較「能耗比」的計算密集應用遇見對手 ARM 也不落下風。
更重要的是,時至今日,宣稱「仍維持 Arm 處理器研發能量,但端賴是否有客戶強烈需求」的 AMD 才「看起來」有踏入 ARM 的雄厚本錢。筆者也很好奇,當這天真的到來,Jim Keller 又會做出多有趣的評論。
無論成功還失敗都非一朝一夕之功
端詳 AMD「重大失敗」,不外乎產品一再延期錯失機會,就是條件不夠成熟時貿然嘗試激進冒險。歷史教訓告訴我們,「正確的時間做正確的事」,永遠比檯面上技術更舉足輕重。
但「塞翁失馬,焉知非福」、「失敗為成功之母」,我們應可做出幾個大膽假設:
如果沒有併購 ATi,AMD 會否繼續創辦人 Jerry Sanders 名言「真男人就是要擁有晶圓廠」(Real men have fabs),延誤完全融入專業晶圓代工系統的時程?
如果沒有發展「山貓」小核與 APU,AMD 能通吃 Sony 和微軟家用遊戲機訂單,變相強迫遊戲軟體廠商務必或多或少最佳化 AMD 繪圖晶片,彌補 AMD 軟體層面對上 Nvidia 的劣勢?
如果沒有 Fusion 野心和 HSA,AMD 還會在 2010 年代初期就默默耕耘各類 2D 3D 多晶片封裝,我們還看得到爐火純青的 Chiplet 策略與集大成的「超級 AI GPU」MI300X 與「終極 APU」MI300A?
諸如此類,皆為不可能有真正答案的大哉問。但談到 AMD 2023 年 2 月市值首次超車英特爾時,Jerry Sanders 欣喜若狂,並稱「我打電話給每個認識的人,只是很遺憾葛洛夫(Andy Grove,英特爾第三任執行長,傳世名言為「唯偏執狂得以倖存 Only the Paranoid Survive」)不在了。假如沒有蘇姿丰與堅定執行戰略,回到十年前,筆者會完全無法想像 2024 年的 AMD 市值竟然將近 3,000 億美元。
(首圖來源:AMD)