「AI PC」堪稱今年 COMPUTEX 焦點,距離「人類出一張嘴叫電腦好好做事」的美好未來,似乎不再遙不可及,但什麼是「AI PC」,卻讓不少人丈二金剛摸不著頭腦,微軟 Copilot+ PC 更增加理解 AI PC 的難度,但其實沒那麼複雜,即使也沒那麼簡單。
你家 AI PC 不等於我家 AI PC
首先,來定義一下 AI PC 吧,顧名思義,就是運行人工智慧推論應用程式的個人電腦。市面任何個人電腦都可執行 AI 應用(如果不管效能),所有 PC 都可廣義稱為 AI PC。
▲ 畢竟是作業系統廠商支配性地位,Windows 平台 AI PC 微軟說了算,甚至能決定處理器市場有多少「玩家」參加,反正只要能賺大錢,或運氣不錯,還能擴大市場規模,賣掉更多授權貼紙。
但一般個人電腦產業,每當提到 AI PC,普遍理解和看法是「配備 NPU(神經處理單元)的 PC」才是 AI PC,如 2023 年 AMD Ryzen 7040 系列(與更新版 8040 系列)與英特爾 Core Ultra 100 處理器,均有 NPU,並可處理高效能、低功耗 AI 應用程式,是狹義的 AI PC。
但很不幸的,AI PC 只是統稱,姑且不論各廠商 NPU 大相逕庭的微架構和 TOPS(Trillions Operations per Second)定義,還另有自家玩法,現行 x86 雙雄產品,都無法滿足微軟的 Copilot+ PC 需求。
Copilot+ PC:能執行 Windows Copilot Runtime 的 PC
微軟 5 月 20 日公布 Copilot+ PC,是多重要素錯綜複雜的 AI PC 行銷方案,類似英特爾 Centrino(迅馳)、Ultrabook、Evo Platform 等計畫,OEM 廠商透過相容 Copilot+ PC 的筆電,與微軟合作行銷,並獲比普通 PC 更高的回扣。
▲ 將 NPU 需要多少 TOPS 束之高閣,Copilot+ PC 說穿了就是「有 Windows Copilot Runtime」,其他都不重要。
英特爾推出 Centrino 行動運算平台時,就將 Wi-Fi 當成必備規格,讓隨處可見的 Wi-Fi 司空見慣,微軟 Copilot+ PC 也試圖強制引進高性能 NPU 讓 AI PC 提升到新水準,與傳統 PC 相比,Copilot+ PC 執行 AI 負載效能提高 20 倍,效率提升 100 倍,要求重點如下:
Windows 11 作業系統。
NPU 性能達 40TOPS,現在僅高通(Qualcomm)Snapdragon X Elite 處理器達此標準,可執行專為 Copilot+ PC 量身訂做的 Phi Silica 小型語言模型,第一個 Token(詞元)延遲為一秒 650 個,僅消耗 1.5 瓦電力。詞元產生流程會重複使用 NPU 的 KV(Key Value)快取,CPU 執行時每秒產生約 27 個詞元。
▲ Windows 工作管理員從此多了 NPU,讓觀察電腦效能這件事又增加新樂趣。
16GB 或更高主記憶體容量。
256GB 或更大儲存空間。
然後現在 Windows Copilot 有以下新應用:
Recall 可協助使用者立即找到 PC 看過的幾乎所有內容,重新定義 Windows 搜尋功能。
Co-creator 是協作式 AI 影像產生器,可協助使用者本機端使用自然語言和墨跡筆劃,將想法變成現實。
Image Creator 幫助使用者圖像生成和照片編輯結合的新風格,重新想像個人照片。
其他功能包括強化後 Windows Studio Effects 和可將 40 多種語言的影片和音訊即時翻譯成即時英文字幕的 Live Caption。
微軟也與第三方開發者合作改版 Davinci Resolve、CapCut、WhatsApp、Camo Studio、djay Pro、Cephable、LiquidText、Luminar Neo 等應用程式,提供更好的使用者體驗。
但這些都不是重點,Copilot+ PC 說穿了就一句話:能執行 Windows Copilot Runtime(執行環境),含相關應用程式、函式庫、部署硬體裝置的模型、開發框架與工具鏈。
現在就算弄到一台 NPU 滿足 40TOPS 的 x86 平台筆電,如採 AMD Ryzen AI 300 處理器,也無法稱為 Copilot+ PC,頂多只能稱「日後有機會免費升級」,道理很簡單:微軟尚未發表 x86 版 Windows Copilot Runtime,暫時還是高通獨占局面。
▲ Nvidia 身為世界最大「AI 算力軍火商」,爭奪 AI PC 定義權也不會缺席,表示「進階 AI PC 需 AI 100~1,000TOPS 運算能力的獨立 GPU」,但也很明顯不是現階段微軟 Copilot+ PC 的重點。對 Nvidia 來說,「本機端訓練」才是最有優勢之處。
AI 世界的 DirectX:將 NPU / GPU 抽象化的 DirectML
此外,各家廠商 NPU 硬體架構不同,長期 Copilot+ PC 也須支援 GPU 端 AI 運算,有必要以類似 DirectX 的 API 中間層(Middleware)「抽象化」硬體底層差異。
▲ DirectML 是 AI 世界的 DirectX,掩蓋 NPU 和 GPU 底層硬體的差異性,也提供 Web 應用程式呼叫 DirectML 的界面。
所以微軟提出 DirectML(Direct Machine Learning),可視為「執行 AI 應用程式的 DirectX」,如遊戲用 DirectX 開發,無論 GPU 是 Nvidia、AMD 還是英特爾,或任一家音效晶片廠商,都可正常執行,開發 AI 應用程式的程式設計師可藉 DirectML,透過 AI 加速器運行 AI 應用程式,不論用誰家 GPU 或 NPU。
Web 應用程式亦可經 WebNN 呼叫 DirectML,達近本機性能的 AI 體驗,以在 Web 端執行生成式 AI、影像等任務處理、自然語言處理、電腦視覺等。
剛起步的 AI 領域,DirectML 會與其他硬體廠商中介層並存,如 Nvidia CUDA、英特爾 OpenVINO、AMD Ryzen AI、高通 AI Engine,但 DirectX 歷史證明最終都會統合成 DirectML,節省程式設計師時間。想當年,Direct3D 終結 3dfx 自家 Glide,DirectSound 更結束創新科技(Creative)聲霸卡(Sound Blaster)的壟斷,歷史總是一再重演,最起碼 Windows 平台注定如此。
▲ 一圖勝千言,紅框部分就是這次微軟 Copilot+ PC 多的新功能,關鍵只有 Windows Copilot Runtime。
你家 TOPS 不等於我家 TOPS
很長時間 AI 領域靜悄悄、Siri 放著爛的蘋果,「總算」接著 COMPUTEX 後的 WWDC 揭露 Apple Intelligence(簡寫也剛好是 AI,應該是故意的)全貌,終究回歸到「橫跨手機、平板、筆電,蘋果擁有大量終端裝置先天優勢」的起點。有了微軟大力投資的 OpenAI 助拳,世人將看到煥然一新、不再要死不活的 Siri。
▲ 平心而論,蘋果 Apple Intelligence 整體架構圖沒什麼亮點,但讓人好奇「Apple Silicon Servers」晶片到底是什麼,是否謠傳中「自研資料中心伺服器處理器」。
但 M4 處理器 NPU「區區 38TOPS」卻號稱「AI 效能打趴所有 AI PC」,網路亦不乏死忠果粉興奮宣稱「蘋果撕破 AI PC 的假象」(會說這種話的人,大概對 Copilot+ PC 一無所知),我們很快就會看到關於 TOPS 定義的爭論和「誰家 TOPS 比較大」。即使 MLCommons 年初宣布開發個人電腦端 MLPerf AI Benchmark Suite,但僅限 Windows,有充分理由相信,幾年內不乏「外行人看門道,內行人看熱鬧」的熱門話題。
▲ 也許到頭來根本無從證明蘋果 M4 的 38TOPS 能不能打趴全部 AI PC,因為很可能根本沒有比較基準。
越來越成熟的 Windows On Arm 生態系
不僅 Copilot+ PC 以高通 Snapdragon X Elite 拔得頭籌,已知效能與續航力表現更輾壓 x86 雙雄,微軟介紹 Windows Copilot+ PC Runtime 時也強調「持續創新並加速 Windows On Arm 開發」,隨著 Visual Studio、.NET 和許多關鍵開發工具都有 Arm 原生版,以及「勢頭持續成長」的 Arm 開發者生態,微軟歡迎更多第三方 Windows 應用程式原生對應 Arm 指令集──即便 Windows 11 24H2 版本添加開發代號「Prism」x86 轉 Arm 的二進位執行檔轉譯器(Binary Translator),但不會有太多人真當一回事。
▲ 如果對 Windows On Arm 原生應用程式的印象停在多年前五窮六絕的慘況,建議看一下這網站,瞧瞧還有哪些常用應用程式尚無 Arm 原生版。
近年微軟和高通一直合作鼓勵獨立軟體供應商(ISV)推出 Arm 原生應用程式,數量也逐漸增加,以網頁瀏覽器為例,Google Chrome、Firefox 和 Opera 皆有 WoA 版,對商務人士很重要的 Teams 與 Zoom 也共襄盛舉,遑論「地球最重要生產力工具沒有之一」的 Microsoft 365(Office)。
雖然像 Adobe Creative Cloud 僅五個 WoA 原生版應用程式(Photoshop、Lightroom、Lightroom Classic、Fresco、Acrobat),但最近追加 Premiere Pro 和必備工具 Media Encoder,微軟也宣布 InDesign、After Effects 和 Illustrator 會跟進,和 x86 一樣完整,只是時間問題,當然,其他軟體公司亦同。
▲ Adobe 應用程式支援性一向是重大指標,現在看來 Windows On Arm 即將功德圓滿。
假使 Windows 使用者能不必顧慮應用程式相容性,並取得接近 MacBook 的「不需關機,隨時可用」良好使用者體驗,甚至讓筆電更便宜,對 x86 雙雄壓力前所未見的大,尤其「從來沒有對行動運算特化處理器下過任何苦工」的 AMD。
微軟十幾年來多次嘗試推動 Arm 版 Windows,從 Windows CE 開始,歷經 Windows 8 時代 Windows Mobile 和 Windows RT,再到 Windows 10 達成 x86 到 Arm 二進位執行檔轉譯器,所謂水到渠成,微軟 Copilot+ PC 看似走上成功終點。
總之,一旦 Windows On Arm 生態系統成熟激化個人電腦市場競爭,對消費者有利無害,畢竟人類和整個計算機工業本就沒有「非要 x86 指令集不可」。但也不可否認,聯發科(MediaTek)此時此刻才跳出來參戰 Windows On Arm,怎麼看都充滿「收割味」。
▲ 或許拜高通和聯發科之賜,很久很久以後,習以為常的個人電腦品牌之外,我們會看到眾多手機廠商進軍筆電市場局面,如果微軟和晶片原廠不阻止。
不過對非西方國家區域,特別是東亞地區如日韓與華人圈,如何安裝第三方輸入法是 Windows On Arm 的大罩門,這偏偏又是最缺乏商業誘因推動 Arm 版的應用,短期內或許得看微軟自家輸入法爭不爭氣了。
(首圖來源:微軟)