Meta 新 AI 模型算力需求大降一個量級!解密 Muse Spark 如何重構技術底層邏輯
Meta 執行長馬克祖克柏宣布,Meta Superintelligence Labs 已達成首個重大里程碑,推出名為 Muse 的全新 AI 模型系列,其首款模型 Spark 現已上線。Meta 在一份公告中指出:「Muse Spark 是我們擴展規模的第一步,也是我們 AI 工作從零開始徹底改革的第一個產品。」
《VentureBeat》報導指出,Meta 一直是生成式 AI 時代最有趣的公司之一,最初憑藉開源 Llama 系列大型語言模型獲得了大量忠實用戶,但去年 Llama 4 發布後評價褒貶不一,最終承認其在遊戲基準測試中表現不佳,Meta 的 AI 發展一度受挫。
隨後,祖克柏在 2025 年夏天徹底改革了 Meta 的 AI 營運,成立內部新部門 Meta Superintelligence Labs,聘請 29 歲的 Scale AI 前共同創辦人兼執行長 Alexandr Wang 擔任 AI 長。如今,Meta 正式向外界展示了這場重組後的成果。
不同於 Meta 過去熟悉的開源路線,Muse Spark 是一款規模較小、封閉的 AI 模型。Alexandr Wang 在社群平台 X 發文強調,該模型是 Meta 目前最強大的模型,並支援工具使用、視覺思維鏈與多 AI 代理編排。值得關注的是,Muse Spark 並非以普通的聊天機器人形式出現,而是圍繞著祖克柏所稱的「個人超級智慧」願景基礎,也就是一種不只能處理文本,還能看到並理解用戶周圍世界的 AI。
原生多模態與思考壓縮:Muse Spark 擠回全球前五的技術底氣
支撐 Muse Spark 走向「個人超級智慧」願景的,是其從底層徹底翻新的原生多模態架構。不同於先前只是把視覺與文字能力「拼接」在一起的版本,Muse Spark 讓視覺資訊能真正融入模型的內部推理流程。這樣的架構轉變,使其具備「視覺思維鏈」能力,例如可在動態環境中進行標註、辨識一台複雜義式咖啡機的各個零件,或透過並排影片分析來糾正使用者的瑜伽動作。
其中最重要的技術突破,是全新的「Contemplating」模式。這項功能可同時調度多個子代理進行平行推理,讓 Meta 得以與 Google Gemini Deep Think、OpenAI GPT-5.4 Pro 這類強調深度推理的模型正面競爭。在基準測試中,這款模型在 Humanity’s Last Exam 拿下 58%,在 FrontierScience Research 則達到 38%。
對 Meta 的商業化佈局而言,更具意義的是這款模型在效率上的顯著提升。Meta 表示,Muse Spark 在實現上述推理能力時,所需算力比前一代中型旗艦模型 Llama 4 Maverick 少了一個數量級以上。這樣的效率躍進來自一種稱為「思考壓縮(thought compression)」的機制:在強化學習過程中,模型若花費過多思考時間會受到懲罰,迫使它在不犧牲準確度的前提下,以更少的推理 token 解決複雜問題。
根據 Meta 分享的評估結果,Muse Spark 在推理和多模態能力方面的部分基準測試中擊敗了 Google、OpenAI 和 Anthropic 的領先模型。《VentureBeat》指出,綜合官方與第三方機構 Artificial Analysis 的獨立審核,Muse Spark 在部分基準測試中已超越 Google 與 Anthropic 的領先競品,成功讓 Meta 重新站回全球「前五大模型」的競爭行列。
底層算力落地變現?瞄準社群電商、健康與互動介面
憑藉著底層架構與推理能力的突破,Meta 正將 Muse Spark 直接導入旗下應用生態,打造更貼近終端使用情境的 AI 體驗。根據公告,Muse Spark 目前已在美國為 Meta AI 應用和網站提供技術支援,未來幾週內將進駐 WhatsApp、Instagram、Facebook、Messenger 和 Meta 智慧眼鏡,並透過 API 以「私有預覽」形式提供給部分合作夥伴。
在具體應用上,這波落地包含三大核心面向。首先是「購物模式(Shopping Mode)」結合 Instagram 與 Threads 上的創作者內容,AI 可分析使用者偏好的品牌、穿搭與貼文風格,提供個人化推薦,讓每一則內容都具備「可購買」的互動能力。
其次在健康應用方面,Meta 與超過 1,000 名醫師合作建構訓練資料,使 Muse Spark 能分析食物照片中的營養成分,甚至針對高膽固醇的魚素飲食(pescatarian diet)給出「健康評分」,逐步拓展至醫療輔助場景。《The Verge》和《TechCrunch》分析,此舉象徵 Meta 進軍醫療健康領域,劍指 OpenAI 的 ChatGPT Health 和 Anthropic 的 Claude for Healthcare。
最後,該模型也強化互動介面能力,可即時生成網頁型小遊戲或教學內容。例如,使用者可將一張圖片轉換成可玩的數獨遊戲,或生成家電操作的重點教學,讓 AI 不只是回應問題,而是直接產出可操作的互動體驗。
直面長時序推理挑戰:Meta 下一步打造「替你完成任務」的 AI
儘管展現強大潛力,Meta 也坦言,這款模型在部分領域仍未達最前沿水準,特別是長時序(long-horizon)的代理式系統以及程式開發工作流程,未來仍需持續投入資源強化。
祖克柏在 Threads 上為這場轉型下達了明確的註腳:「展望未來,我們將持續推出更先進的模型,推進智慧與能力的邊界,包括新的開源模型。我們正在打造的不只是能回答問題的產品,而是能替你完成任務的 AI 代理。」
【推薦閱讀】
◆ Anthropic 不敢全面公開的 AI:Claude Mythos 為何正在重寫網路安全規則?
*本文開放合作夥伴轉載,資料來源:Meta 1、Meta 2、《VentureBeat》、《mashable》、《Financial Times》、《The Verge》、《The Wall Street Journal》,首圖來源:Meta