請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

從各種角度檢視 Apple Silicon M1 的優劣勢與真正造成的影響

科技新報

更新於 2020年11月30日17:30 • 發布於 2020年12月01日08:00

蘋果發表初代「Apple Silicon」M1 處理器後,其優異的效能表現,加上多年來世人對「擠牙膏」的 Intel 和「毫無道理可尋」x86 指令集,長期累積的不滿,一次「業力引爆」,導致很多人瞬間失去了知識、理智和常識。

除了網路上滿滿的吹捧其跑分效能的歌功頌德文,以排山倒海之勢,把人炸得昏頭轉向,連更換底層硬體架構之後最重要的軟體相容性都忘的一乾二淨,更不乏「微軟將棄 x86 而典範轉移到 ARM」、「Wintel 即將土崩瓦解」和「蘋果將強勢重返伺服器市場」等缺乏邏輯的橫空高論,紛紛傾巢而出,彷彿讓人活在蘋果早已統治電腦工業的平行時空。

筆者將會深入探討蘋果 M1 的優勢、劣勢與對業界造成的真正影響,但在一堆人還在一頭熱的當下,為了避免任何的誤解,索性先將「結論」寫在前頭:

  • 蘋果 M1 的優異效能的根本基礎是台積電 5奈米製程與 160 億電晶體,這簡單的道理,只要想想還在受困於10 奈米製程良率,和 AMD Zen 3 依舊停在台積電 7 奈米,即可明白。

  • 蘋果 M1 的優劣勢皆來自於其封閉生態體系,蘋果過去強行將 iOS 和 macOS 的應用程式全面 64 位元化,就是為了 Apple Silicon 的長遠布局,讓他們可以專心針對 64 位元 AArch64 最佳化,無須顧慮 32 位元昔日包袱的執行效率。

  • Apple Silicon 並非毫無風險,不只轉型陣痛期(請參考這篇文章,已獲得原作者 Tenz 同意),更賭上了「究竟會有多少「假果粉」Mac 用戶非要安裝原生 Windows 不可」和「會因為更好的整合性,願意皈依蘋果神教的新興信眾」,哪一邊會比較多。

  • 只要蘋果沒有想不開出售晶片給其他人,或著微軟「三太子上身」棄 x86 轉向 ARM,就算蘋果自研處理器在自己的電腦上跑自家的軟體再快,Mac 區區不到 7% 的個人電腦市占率和不足 2,000 萬台的一年出貨量,絲毫動搖不了 Wintel 和 x86 生態系統的基本盤。

  • 在商言商,戰略重心早已轉向雲端的微軟,作業系統從 x86 全面轉移到 ARM,或著只弄出個特化版 Windows,現階段對他們根本一點好處也沒有,做個 M1 原生的 Office 就該謝天謝地了。

  • 同理可證,最終目標放在維持自家生態系獲利的蘋果,自然也沒有「撈過界」的必要。自從 iPhone 4 開始使用自己的 A4 處理器,蘋果就從未對外銷售晶片,有什麼理由相信他們會瞬間策略大轉彎?

  • 有鑑於過去 Xserve 和 Xserve RAID 的慘痛教訓,蘋果很難有動力重返因出貨重心轉移到雲端巨頭自行客製化的資料中心,而導致利潤早已大不如前的品牌伺服器市場。

  • 蘋果 M1 對業界真正的影響與對 Intel、AMD 最不利的因素,在於這將鼓勵雲端巨頭更積極的打造自用的 ARM 伺服器處理器,而這也是以 ARM 為首的晶片 IP 生態圈最重要的價值:用最短的時間和最少的費用,用拼積木的方式,研製出 Time To Market 的產品。

  • AMD 重新啟動 K12 微架構專案,推出相容 ARM 指令集的 EPYC,可能性慢慢的上升中,假若成真,「處理器遊俠」Jim Keller為此回鍋 AMD(他先前在 AMD 時,原本要操刀這個專案),也不會是太令人感到意外的發展。

  • 以電腦工業歷史的角度,從 A4 到 M1 的發展歷程,象徵著「只要有製程優勢和夠大的市場基本盤」,RISC 絕對比 CISC 更能輕易生出兼具高效能與低功耗的處理器微架構,這是 IBM 無緣享有的先天利基。

大概就是這樣,但還是強烈建議各位繼續硬著頭皮看下去,你將會有更多的收穫。

天底下的任何奇蹟和慘劇皆需天時、地利與人和

蘋果 M1 的單執行緒跑分一舉追上 Intel 和 AMD 的最新 x86 微架構(Willow Cove、Zen 3),其實並不會讓人感到一絲一毫的意外,畢竟天時、地利、人和,都站在蘋果那邊。大家還記得電影少林足球的強雄的經典台詞嗎:「球證、旁證、技術委員、主辦、協辦、所有單位都是我的人,你們怎麼跟我鬥!」

(Source:蘋果)

天時:台積電和 Intel 製程技術出現了看似一去不回頭的死亡交叉。在過去,x86 指令集相容處理器之所以能夠跟「高效能」劃上等號,仰仗著領先眾多 RISC 體系的製程技術優勢,以及蓬勃發展的個人電腦市場,才有那個資源去支撐動輒 3 到 5 年的產品開發週期,現在反倒是蘋果占了這些便宜。

地利:靠著 1 年超過 2 億支 iPhone 和 5,000 萬台 iPad 的雄厚本錢,蘋果率先啟用台積電 5 奈米製程,而 Intel 卻連擠 10 奈米牙膏都擠不太出來。至於 AMD 大概都準備把有限的資源,集中在 5 奈米的 Zen 4 和 3 奈米的 Zen 5 了。

人和:蘋果在 2017 年底的 iOS 11 完成了 iOS App 純 64 位元化,也在 2019 年 macOS Catalina 全面終止 32 位元 App 支援,不但讓蘋果可全心全力發揮 64 位元 ARMv8-A 的潛能,也簡化了 Rosetta 2 二進位碼動態轉譯器的複雜度,只要轉換 x86-64 到 ARMv8-A,而且也不包含難搞的 AVX、AVX2 和 AVX-512,這對改善效能當然也有立竿見影的效果。

當 RISC 處理器享有昔日 x86 的製程優勢與市場規模

智慧型手機就像昔日的個人電腦,給了消費型 RISC 處理器一塊逐漸茁壯的沃土。蘋果 M1 的最大成就,莫過於將 IBM Power 等級的超高階 RISC 心臟,以一般人可以接受的成本與價格,搬到了筆記型電腦裡面,創造了地球上最強大的行動式運算處理器。

當年曾經參與 PowerMac 的 IBM 高層與眾多 RISC 先驅者,看到蘋果終於在 M1 修成正果,不知是否後悔並未認真替蘋果研發適用於筆電的 PowerPC 處理器,眼睜睜的看著 Power Everywhere 戰略大計,失去了最大塊的基本盤,使其終究沒有實現的可能性。

時過境遷,讓人不勝唏噓,更使人不得不好奇,2 位當代 RISC大師 David Patterson 和 John Hennessy,會如何在未來的新版電腦組織結構教科書中(白算盤、計量方法),對 蘋果 M1 寫下怎樣的評語。也許他們的心情也會五味雜陳吧?

抽絲剝繭 M1 為何如此強大

看跑分看得很爽是一回事,但要透徹領悟支撐這些數字的技術卻非常的困難,筆者就先依據列出幾個規格,比較蘋果 M1(高效能 Firestorm、低功耗 Icestorm)、Intel Tiger Lake-U(Willow Cove 微架構)、AMD Ryzen 5000 系列(Zen 3 微架構),讓各位瞧瞧台積電 5 奈米製程和 160 億電晶體的威力究竟有多麼巨大。因 GPU 相關資料仍過於有限,本次聚焦在 CPU 的部分。

光從這張電晶體數量、晶粒面積和整合的功能,就足以見證台積電 5 奈米製程有多麼的可怕,這才是 M1 強大的根基,其他的講再多都是多餘,也讓人極度期待 AMD Zen 4 的規格與表現。

再來看看決定 IPC(Instruction Per Cycle,每個時脈週期的執行指令數)上限的指令解碼寬度和非循序指令執行核心(OOOE,Out-Of-Order Execution)的重新排序緩衝區(ROB,ReOrder Buffer)。乍看之下,M1每個時脈週期最多可解碼 8 個指令(其實從 A11 就差不多是這樣了),完全是 IBM Power 的等級,似乎很厲害,但這本來就是指令編碼格式統一、長度固定的 RISC,應當享有的先天優勢。更何況,一個「相對簡單」的 x86 指令,其工作量可能就相當於 1.5-2 個 ARM 指令,Intel 和 AMD 又有微指令快取加持,換言之,解碼器寬度的差異性並沒有那麼大,唯一可以確定的是複數 x86 指令集的解碼器,真的非常的難實作。

但非循序指令執行核心的規模差距就讓人瞠目結舌了,幾乎都是最新型 x86 微架構的 2-3 倍,世上唯一凌駕於蘋果的,只有單一核心可同時運行「1,000 個指令(In-Flight)」的 IBM Power10 了。同場加映 ARM 本家最強的 Cortex-X1:ROB 也只有 224。此外,藉由 4 個 128 位元 NEON 運算單元,Firestorm 的浮點指令輸出吞吐量,為現有新型 x86 微架構的 2 到 3 倍。就算論資料更寬的 SIMD 指令集,「極度向量電腦化」的 SVE(Scalable Vector Extension),其未來性也遠勝於 AVX-512,就看蘋果想不想用。

蘋果歷代 Ax 處理器一直有一個為人稱道之處:規格簡單粗暴、但性能表現強大到讓人感覺很不真實的記憶體子系統,M1 Firestorm 核心「6 倍」於 Intel AMD 的 L1 指令快取,在前代 A13 就有 128kB 的等級。Icestorm 的 L1 指令與資料快取容量分別是 128kB 和 64kB,但也多於現有 x86 核心,連 4 核共用的 L2 快取也有 4MB。

當然,x86 因大量指令直接以記憶體做為運算目標、使其非常的「Memory Intensive」,以及指令格式混亂,激增了快取記憶體的複雜度,但「其他」的 ARM 指令集相容處理器至今仍遠遠不及蘋果的成就,卻也是不爭的事實。

不過,在規格表上看不到的祕密是:iOS 11 全面軟體生態系統 64 位元化之後,蘋果 Ax 處理器「很可能」早就放棄 32 位元相容性(或著就算能用也是跑得很慢),這是連 IBM 都無福消受的天大優勢,畢竟數十年來,還是有一大票老舊的企業伺服器應用程式,在今天還在線上服役。也因此,當震驚於 M1 的優異表現之餘,各位也請冷靜的想想,這根本就是一場不公平的競賽,而蘋果 M1 與其後代,也註定難以走出自家的封閉花園,有誰會想要一顆跑 32 位元應用程式很慢、甚至根本不能用的 ARM 系統單晶片?

重回伺服器市場的機會還是非常渺茫

這年頭只要一提到「高效能」,很多人的身體就會本能性自動反應「進軍伺服器」,不過「伺服器」等級的處理器,並不是空有高效能,即可功德圓滿,高可用度、高穩定度、更精細的虛擬化管理機能、更完備的管理機制、與作業系統高度整合的錯誤回報技術,都是必要的條件。充足的 I/O 完整度、供給充沛頻寬和容量的記憶體子系統、大型化多處理器 / 多核心仰賴的高效率快取資料一致性協定(Cache Coherence)等,更是不可或缺。很明顯的,目前這個 M1 還是遠遠不及 IBM Intel 和 AMD。

某些高人相信蘋果可以一步一步慢慢來,先從「邊緣運算(Edge Computing,如歐洲電信標準協會定義的 5G MEC)」伺服器切入,但也得蘋果有類似電信營運商的需要。更何況,邊緣運算伺服器,往往會被佈署在環境較為嚴苛的地點,等於一腳踏入工業電腦廠商的守備範圍。除非蘋果對「伺服器」有著突破性的定義和創新,否則像 Google 雲端 TPU 一樣「自研自用」替使用者提供雲端服務,是最有可能的方向,但也絕非一蹴可及。

(Source:shutterstock)

關於蘋果是否將重回品牌伺服器的議題,無論如何,機會都非常的渺茫,況且蘋果在「企業端軟體解決方案」這部份的資產幾乎是零,為此開闢一個獲利不高的血腥戰場,對他們並不划算,沒必要重蹈當年 Xserve 的覆轍。

延伸到自家資料中心的可能性激增中

話說回來,看在蘋果的 Mac Pro 裡面還有一顆「28 核心」Xeon 要用自家晶片取而代之的份上,說沒有高階產品的開發計畫,絕對是騙人的,這也可能觸發蘋果連資料中心都逐步轉移到自家晶片的可能性。蘋果在 2015 年在其資料中心將 VMware 轉向開源的 KVM,現在看來,並非區區只為了節省 2 年 2,000 萬美元的軟體授權費用,背後隱藏了更巨大的布局。

只不過,到頭來,這些目前尚未存在的「伺服器等級 Apple Silicon」,也是蘋果自家限定,外人無緣一親芳澤。只希望這間公司哪天想開了,願意站上 IEEE、ISSCC 和 HotChips 的演講台,讓世人一窺其神秘晶片家族的廬山真面目,但這件好事成真的機會還是很渺茫就是了。

總之 M1 的下一步?

M1 只是蘋果小小的第一步,後繼將會推出更高階的產品,但對蘋果最重要的並非效能,而是設法加速軟體生態圈轉移到原生版程式的進度,像時下「Rosetta 2 跑得不順、甚至無法安裝應用程式」、「印表機等週邊驅動程式無法運作」、「電池續航力遠不如官方宣稱的持久」等,都是蘋果急需迫切解決的難題。

雖然蘋果生態圈常見「只要搞定微軟 Office 和 Adobe 就等於解決 80% 需求」的論點,但除非你只會用得到 Safari 和 macOS 內建的應用程式,要不然當下的確不是入手 M1 心臟 MacBook 的好時機。

從 M1 回頭檢視 RISC 與 CISC 的戰爭

人類第一台 RISC 電腦 IBM 801 計畫的主持人 John Cocke,假如地下有知,應該會感慨萬千吧。長期壟罩在 80x86 陰影之下的電腦工業,彷彿暗雲散去,照出了一道道充滿希望的曙光。

「x86 義和團」和「RISC 十字軍」的戰爭,持續了 20 幾年,隨著前者的自滅和 M1 的問世,後者近來開始有「蠕動」的跡象。但筆者還是得提醒一個血淋淋的前提:蘋果是一個「瓶中生態系」的封閉花園,裡面再怎麼枝繁葉茂,就像茶壺內的風暴,對外面的世界幾乎難以帶來直接的衝擊。

反過來說,蘋果 M1 的誕生,對整個電腦工業界並不算壞事,最起碼足以讓 Intel 和 AMD 受到更強烈的刺激,促使他們加快研製更性能強悍的處理器,而不是像 Intel 的 Skylake 微架構一樣,一用就是 4 年,然後這段「牙膏期」就讓 ARM 指令集相容處理器,效能激增到足以挑戰高階 x86 微架構的水準。

庫克終於實現了賈伯斯的未竟之志

將冷冰冰的技術規格束之高閣,來談點比較感性的東西。

回顧蘋果在 2008 年併購 P.A Semi 時,外界普遍不看好賈伯斯的大膽決定,也一度無消無息到讓人以為蘋果早就放棄了,直到 iPhone 4 才讓大家知道蘋果是玩真的。12 年來,在這個研發先進製程高效能處理器動不動就燒掉 10 億美元的年代,蘋果持之以恆的將自己的晶片一步一步從手機平板推進到自家的 Mac,怎麼算都耗費了數十億甚至上百億美元都有可能,所以這也是筆者對於那些宣稱 Apple Silicon 單價只有「幾十美元」的產業分析師嗤之以鼻的主因,你們是以為「研發」這件事是不用成本的嗎?

蘋果熬了這麼久,也做了這麼多的超前佈署(軟體生態純 64 位元化、資料中心捨棄 VMware),背後一定滿滿來自賈伯斯那未竟的執念,而庫克總算實現了他的夢想,這才是 M1 處理器,真正讓筆者有感的地方,也沒有任何東西比 M1 更能弔祭已不在人世的史蒂夫·賈伯斯。

接著,也該準備談談 P.A Semi 的歷史了。

(首圖來源:Henriok, CC0, via Wikimedia Commons)

0 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0
reaction icon 0