請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

從 M1 Pro 與 M1 Max 的暴力美學,回顧構成蘋果晶片研發團隊骨幹的 P.A. Semi 與 Intrinsity

科技新報

更新於 2021年11月02日08:58 • 發布於 2021年11月02日08:00

當 1919 年「總體經濟學之父」凱因斯(J. M. Keynes)回顧性檢討第一次世界大戰時,所著《和平的經濟後果》這樣說:「權力政治無可避免。關於這次戰爭和結束並沒有新教訓:英國還是像過去每世紀,毀滅了一個貿易勁敵。」

這也是筆者10月26日看完新MacBook Pro發表會後,回想構成蘋果晶片研發團隊骨幹P.A. Semi和Intrinsity後唯一感想。蘋果依舊在無拘無束的封閉花園內,把最簡單的事做到最完美的「暴力美學」,貫徹到兩顆巨無霸系統單晶片。當然,遊戲應用還是Mac罩門,再強的GPU恐怕都救不回來,但可大幅提高Mac用戶的「生產力」就足以灑花放煙火了。

M1完全體:驚人的橫向擴展

如果說一年前M1只有讓人印象深刻的驚人單執行緒效率,今年M1 Pro與M1 Max則告訴世人,蘋果如何「硬幹」出M1的巨型橫向擴張版(快取記憶體階層也維持現有結構),並靠看似用不完的大量記憶體理論頻寬,支撐超出兩倍現行x86筆電處理器的多執行緒浮點運算效能。論能耗比,大概也沒啥好比較的空間了。

從晶粒圖可清楚看出,M1 Pro和M1 Max的差別就在後者下方多「長出」額外16核GPU、兩組128位元寬LPDDR5記憶體控制器、兩塊16MB系統層級快取記憶體(SLC,Systel Level Cache)、最底部疑似「兩倍規格NPU」的部分。蘋果也並未在M1 Pro / Max修改處理器核心的微架構,八個大核區塊延續M1四核一組共用12MB快取記憶體,兩小核、16核類神經網路單元和SLC,也幾乎原封不動從M1搬到M1 Pro / Max。

這種看似高度模組化、彷彿把CPU當成GPU做的手段,乍看之下似乎很簡單(M1家族三款晶片應該是一起開發),但光想到M1 Max是巨無霸晶片,要考慮到維持低功耗並搞定內部匯流排的訊號走線和時脈區域,就很不得了了。

截至目前,論「堆積木」於泛用處理器世界,唯一可大膽說「叫我第一名」的恐怕只有IBM,從Power9開始,創造「一個大核拆成兩個小核」的世界奇觀,並延續到新一代Power10。但別忘了一件事:M1 Pro和M1 Max是「消費級產品」,IBM Power9 / 10卻是單價「1萬美元」為基本單位的伺服器怪物。

蘋果為何可在M1 Pro和M1 Max做到這些事,就不得不追溯蘋果自研晶片研發團隊的起源:P.A Semi與Intrinsity了。了解這兩間公司的背景和專長,就不難預期蘋果今日成就與未來想幹的大事。畢竟蘋果從來不公開技術細節,也從不參加處理器業界學術交流活動(哪天出現在ISSCC和HotChips演講台,太陽都要從西邊出來了),要推敲蘋果幹了啥好事的線索,也就只剩下被併購的公司了。

簡單結構的延展性:P.A. Semi

2008年4月,蘋果以2.78億美元收購某無晶圓廠晶片設計公司,聽說不小心得到150名天才工程師。

公司名叫P.A. Semi,創立於2003年,位於美國加州Santa Clara,由曾在2003年獲頒IEEE Solid State Circuits Award的晶片設計大師Daniel W. Dobberpuhl成立。

Daniel W. Dobberpuhl在1976年加盟DEC,參與過1980年代這間公司最成功的產品MicroVAX,也歷經過對後世影響深遠的DEC Alpha 21064與StrongARM。隨著StrongARM從DEC移轉給英特爾,Daniel W. Dobberpuhl創立SiBytes,專注MIPS指令集的高速網路處理器,2000年被博通併購。Daniel W. Dobberpuhl於2019年10月26日辭世,享年74歲。

今日蘋果A系列與M系列處理器之所以有今天表現與地位,除了封閉性生態系統帶來的先天「不對稱」優勢,P.A. Semi團隊絕對居功厥偉。

▲ Daniel W. Dobberpuhl。

值得一提的是,同樣待過DEC並參與Alpha 21164和21264的「處理器遊俠」Jim Keller於1999年入職SiBytes,接著在博通擔任首席架構師,又在2004年轉戰P.A. Semi任職工程副總裁。他在Daniel W. Dobberpuhl領導下,累積低功耗RISC處理器的豐富經驗,直到2008年P.A. Semi被蘋果併購,也仍留在蘋果服務不短時日,參與A4和A5研發。

▲ Jim Keller。(Source:影片截圖)

P.A. Semi當時研發名為PWRficient的產品線,顧名思義,就是追求極致能耗比的處理器。總計分成三部分:相容PowerPC指令集的PA6T核心、CONEXIUM晶片內連結架構、ENVOI I/O子系統。後來蘋果自研處理器的諸多特色,或多或少都可在PWRficient摸索到蹤跡,也可從遺產判斷蘋果自家晶片未來的可能方向。基本上,筆者只能說M1 Pro / Max問世,就是開花結果的時刻,即使相隔超過12年,實在有點漫長。

PA6T核心在時脈2GHz時,最高功耗不超過7W,1.5GHz時更低至4W,雙核心PA6T-1692M在時脈2GHz時,整顆標準功耗僅13W,最高也不超過25W。相較同時期衍生自伺服器應用的IBM PowerPC(如PowerPC 970家族),無論同時脈效能(SPEC CPU 2000)和能耗比,均享有壓倒性優勢,P.A. Semi也不搞大型化多層快取記憶體「金字塔」。

省電歸省電,PA6T仍是貨真價實的多指令派發、非循序執行的高效能微架構,浮點運算性能尤其出色,約為同時脈IBM PowerPC 970的「兩倍」(別忘了PowerPC 970源自Power4)。因此當時不乏蘋果將用P.A. Semi產品取代IBM和Motorola的傳言。

不過賈伯斯卻在2005年選擇了英特爾。假使蘋果當年直接用P.A. Semi晶片打造MacBook Air,而不是「連根拔起」轉進英特爾,那計算機工業界的歷史,恐怕就會重新改寫,最起碼IBM的Power Everywhere看來不會變成幻夢一場。

但這並不代表蘋果不重視P.A. Semi的價值(要不然也不會花錢併購了),P.A. Semi也並非如外界刻板印象,只想做低功耗的低階產品。反之,P.A. Semi PWRficient一開始就放眼各式各樣應用,並具備強大的多核心延展性。據已知資料,PWRficient將有16核版。

伺服器也是P.A. Semi鎖定的目標。換言之,P.A. Semi的目標可歸納為一條公式:StrongARM的低功耗+Alpha等級的高效能+PowerPC指令集相容性,都是當時最重要的指標。

不過蘋果收購P.A. Semi後也非一帆風順,雖然接收150名天才工程師,但Dan Dobberpuhl與數名重要的工程師,因對兩間公司的整合方式與股票獎勵制度不滿,2009年底先後離開蘋果,一起創立了Agnilux,不到一年就被Google買走。這次Daniel W. Dobberpuhl並沒有跟著進入Google,而成為機器視覺廠商Movidius的董事會主席,而Movidius則在2016年成為英特爾的一部分。

最佳化的電路設計:Intrinsity

蘋果吃掉P.A. Semi後,卻遲遲看不到自家晶片,甚至獨創核心微架構問世,他們該怎麼辦?

蘋果2010年4月發表首款自研處理器A4(APL0398,iPhone 4的心臟),衍生自三星S5PC110A01,最主要的差別在於GPU換成蘋果長期偏好的PowerVR SGX系列,但完全一模一樣的ARM Cortex-A8核心卻大有來頭,因得到Intrinsity公司的技術加持,延續和三星合作「Hummingbird」的成果,時脈從ARM公版的650MHz一舉推進到1GHz大關。

成立於1999年、設立在美國德州奧斯汀的Intrinsity,強項在最佳化Wave Pipeline(無鎖存管線)電路設計,命名為FastMATH。當蘋果認知到這間公司的重要性後,就馬上出手收入囊中,但過程卻極度低調,連確切時間和收購金額都無人知悉(據說是5千萬美元,但也有其他版本)。唯一可確定的是,蘋果目的非常明確,就是為了A4處理器。接著出自P.A. Semi團隊的獨特微架構Swift,就在2012年9月A6堂堂登場,開啟Apple Silicon之路。

Intrinsity人數就沒P.A. Semi那麼多了:22名業界老兵。

Intrinsity的FastMATH最有名成功案例,是超低功耗的MIPS32指令集處理器,時脈2GHz時只有4W,1GHz時更只有1.5W。蘋果得到Intrinsity後,更讓從P.A. Semi獲得的深厚功力提升更高。如何將特殊電路設計技術有效用到台積電最新製程,也是Intrinsity厲害的地方。

Apple Silicon的下一步?

看到這裡,想必各位一定會好奇,穩扎穩打、持續推陳出新的Ax與Mx之外,蘋果下一步會踏入哪些新領域呢?坦白講,目前看不出來。但我們有充分理由相信,在商言商,蘋果不太可能重回品牌伺服器與儲存設備市場(很久以前的Xserve和Xserve RAID),就算要打造伺服器等級處理器,也是關起門來自己用,頂多像Google和AWS出租雲端CPU,這不太像近期會成真的可能性。

話說回來,Apple Silicon效能表現看起來再好再威,影響範圍也只限蘋果生態圈和用戶,會不會真的讓微軟卯起來「有為者亦若是,將現有Wintel生態系統整個砍掉重練」,還得好好觀察。

唯一可確定的是,搞不好某些骨灰級果粉也許不太在乎M1 Pro和M1 Max究竟有多厲害,可能還比較關心「終於回歸」的HDMI連接埠、SD卡插槽、MagSafe充電線、改回實體功能鍵的Touch Bar、鍵盤手感,以及意外附贈的「瀏海」。說到底,決定使用者體驗的因素並非只有效能,冤有頭債有主,蘋果個人電腦市占率至今仍無法突破10%,終究還是有原因。

(首圖來源:蘋果)

查看原始文章

更多科技相關文章

01

路透:輝達擬提高H200晶片產量 因應中國強勁需求

路透社
02

英特爾已測試涉中晶片設備 外界憂可能用於先進製程

路透社
03

迪士尼10億美元注資OpenAI Sora可使用經典角色

路透社
04

美參議員華倫籲黃仁勳出席聽證 說明川普售中國晶片決策

路透社
05

微軟強化 Windows 11,FSE、ASD 助力遊戲體驗升級

科技新報
06

3大電信影音收視榜揭曉 韓綜台劇動漫3大主力

卡優新聞網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...