AWS AI 版圖大爆發!拆解新自研晶片、可客製化 LLM、AI 工廠的背後野心
AWS 本週在拉斯維加斯舉辦一年一度的 AWS re:Invent 2025,一口氣丟出超過 30 項與生成式 AI、代理式 AI 相關的新服務與更新。對企業來說,這不只是又一場雲端新品發表,而是亞馬遜試圖用「從模型、晶片到資料中心」的全端架構,搶占下一輪 AI 代理與基礎建設商機。
這場基礎建設佈局的核心,可以濃縮成三個亮點:全新 Nova 大型語言模型家族、自研 Trainium3 AI 處理器與下一代 Trainium4 路線圖,以及把雲端算力打包成「AI Factory」的整套方案。
亮點一:Nova Forge 客製能力受矚、AI 前沿代理上線
這次 re:Invent 上,AWS 把自家 Nova 模型直接升級到第二代,推出 Nova 2 Lite、Nova 2 Pro、Nova 2 Sonic 與 Nova 2 Omni 四款前沿模型,主打「推理能力」與「代理式任務處理」。
Nova 2 Lite 被定位為價格效能比最高的推理模型,能處理文字、圖片與影片輸入並產生文字輸出,被 AWS 形容為未來企業在大量上線應用時的主力。官方評估指出,Nova 2 Lite 在多數基準測試上,表現與 Claude 4.5 Haiku、GPT-5 Mini、Gemini Flash 2.5 相當,甚至在部分測試中略勝一籌,且可調整呈現思考步驟的程度,試圖讓企業在成本與推理深度之間自行取得平衡。
Nova 2 Pro 則是 AWS 目前最「聰明」的推理模型,鎖定多文件分析、進階數學、影片推理與複雜代理工程等任務,也能作為其他專用模型蒸餾的專家模型。Nova 2 Lite、Nova 2 Pro 兩者皆內建 grounding 與程式碼執行能力,方便企業直接用於工具調用與代理式流程。
語音與多模態方面,Nova 2 Sonic 是語音對語音模型,支援多語言、具備 100 萬 token 的超長對話上下文,能在對談中自然轉換主題;Nova 2 Omni 則是完整多模態推理模型,可同時處理長文本、長影音與大量圖像,單次能吃下約 75 萬字內容,並對整個產品型錄、顧客推薦、品牌指南與影音素材做整體分析,生成文字與圖片輸出。
不過更具戰略意義的是新服務 Nova Forge。AWS 把「客製化前沿模型」變成產品:與一般微調不同,Nova Forge 採用「開放訓練」設計,允許企業在 Nova 2 Lite 的訓練過程不同階段導入自家專有資料,包含預訓練,打造只屬於自己的前沿模型,AWS 把這類客製模型稱為「Novella」。
「每家公司都在尋找一款能成為其領域專家的前沿模型,」負責 Amazon AI 相關業務的 Rohit Prasad 告訴《WIRED》。
隨著底層就緒,AWS 順勢推出 Frontier Agents,這是能持續運作數週、主動學習團隊偏好的自主代理,首波鎖定工程與資安領域,目標是讓 AI 代理在幾個月內成為團隊的一份子。
亮點二:Trainium3 效能翻倍,下一代將「與 NVIDIA 共生」
要支撐上述模型與 AI 代理願景,AWS 端出新一代自研 AI 晶片 Trainium3,並加強垂直整合能力,推出 Trainium3 UltraServer 系統。
Trainium3 採用 3 奈米製程與自家網路技術,單台 UltraServer 可搭載 144 顆 Trainium3 晶片,訓練與推論效能較上一代快超過 4 倍、記憶體也提升 4 倍。多台 UltraServer 可擴充至 100 萬顆晶片,是前一代系統上限的 10 倍。在能源效率上,Trainium3 系統相較上一代節省約 40% 能耗。
更耐人尋味的是 AWS 公布的下一步:Trainium4 正在研發,未來將支援 NVIDIA 的 NVLink Fusion 高速互連。也就是說,之後的 Trainium4 系統,可以與 NVIDIA GPU 混合協作,同時保留 AWS 自家伺服器機櫃與網路架構優勢。
在 CUDA 已成為 AI 軟體生態「共通語言」的情況下,這樣的相容設計,等於是在向原本建立在 NVIDIA 用戶招手,拉它們進入 AWS 的基礎設施版圖。
亮點三:AI Factory 整廠輸出,滿足主權與高安規需求
如果說 Nova 模型是軟體大腦,Trainium 是硬體肌肉,那 AI Factory,則是把這一切變成「整廠輸出」的方案。
所謂 AWS AI Factories,是專為政府與大型企業打造的 AI 基礎建設方案,目標客戶是那些想要大規模部署 AI,卻又不想、或無法自行建置超級資料中心的組織。
AI Factory 整合了 NVIDIA Grace Blackwell、Vera Rubin 架構 GPU 與 AWS Trainium 晶片、高速低延遲網路、高效能儲存與資料庫、安全機制與節能基礎建設打包,再加上 Amazon Bedrock 等全套服務,讓客戶可以直接在這套環境上開發與部署 AI 應用。針對公部門市場,AI Factory 的設計也對應不同等級的安全需求,從 Unclassified 到 Top Secret 的機密等級都有對策。
《SiliconANGLE》分析,從 AI Factories、Trainium、Nova Forge 到 Frontier Agents,AWS 正在將雲端重新打造為一個「代理式 AI 系統」的工廠:能學習、推理、行動,並能長期自主運作。
從完整佈局來看,AWS 正在將 AI 工業化。對企業、新創、雲端與基礎建設業者而言,這代表著一個全新的典範開始:每家公司都能擁有自己的前沿模型、自己的代理團隊、以及屬於自己的 AI 驅動未來。
*本文開放合作夥伴轉載,資料來源:《SiliconANGLE》1、《SiliconANGLE》2、《TechCrunch》、《WSJ》、《DCD》、《WIRED》、《VentureBeat》、《NEXTGOV》,首圖來源:AWS