請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

【搶先 DeepSeek 出招】Moonshot 發表 Kimi K2.5,押注 AI 代理下一前沿:代理群

TechOrange 科技報橘

更新於 10小時前 • 發布於 18小時前 • 廖紹伶

在中國 AI 領域備受矚目的 DeepSeek 即將發布重大更新之際,另一家由阿里巴巴重金支持的 AI 獨角獸 Moonshot AI(月之暗面)率先發動攻勢,正式推出了其最新旗艦模型 Kimi K2.5。

這款開源模型不只具備處理程式碼、圖像與影片的全方位多模態能力,更同步推出了開發者工具 Kimi Code,直接對標 Anthropic 旗下廣受好評的 Claude Code,顯示出中國在 AI 開發工具領域的強烈野心。

Kimi K2.5 的效能表現

在外界最在意的表現指標上,Kimi K2.5 被視為在開源同級模型中領先,並縮小了與封閉頂級模型的差距。在人類最後考試(Humanity’s Last Exam,HLE)基準測試中,Kimi K2.5 在搭配工具使用的情況下拿下 50.2% 的成績,超越 OpenAI 的 GPT-5.2(xhigh)與 Claude Opus 4.5。

Kimi K2.5 在 SWE-bench Verified 測試中也取得 76.8% 的表現,但 GPT-5.2 與 Opus 4.5 仍以 80% 與 80.9% 的成績領先 Kimi K2.5。不過,Moonshot AI 指出,單靠跑分其實無法完全反映 AI 的真正價值。他們更在意的是,AI 到底能幫使用者省下多少時間。

圖片來源:Kimi.ai

中國模型大戰進入「代理群」時代

Moonshot 這次的野心,不只在多模態或寫程式本身,而是把下一個前沿焦點押在「代理群」(agent swarm):讓模型不是只會跟你對話,而是能自主管理一群分工明確的子代理,並行完成一個大型任務。

Kimi K2.5 的設計理念是把「群體編排」直接內建進模型:模型可以自我指派最多 100 個子代理並行工作,處理如程式撰寫、測試、除錯、文件整理等不同子任務,並在必要時彼此交接工作,而主模型則負責整體協調。Moonshot 也宣稱,這套機制可支援高達 1,500 次工具呼叫的平行工作流。透過多代理平行運作,原本需要花好幾天完成的複雜工作,現在可能幾分鐘就能搞定,這才是 Moonshot 認為最重要的衡量標準。

《VentureBeat》分析,這種把框架做的事塞進模型的做法,對許多資源有限的團隊尤其有吸引力:你不一定要先搭好一整套代理編排框架,才能開始做多代理工作流。對定義現代 AI 堆疊的從業者來說,Moonshot 等於直接發了一支「合成勞動力」,讓一個工程師一下指令驅動 100 個代理同時開工。

不過報導指出,儘管此類編排模式具有吸引力,部分企業仍可能避免使用,並選擇透過外部平台,將模型訓練與代理任務分離。這是因為,企業通常希望在代理所使用的模型上保有更高彈性,能依不同任務需求,打造由多種大型語言模型組成的代理生態系。目前,像 Salesforce、AWS Bedrock 和 IBM 等平台,都已提供完整的管理與監控工具,幫助企業整合不同 AI 代理,讓它們能夠順利協同運作。

API 定價激進、開源但有條件

在 API 定價方面,Moonshot AI 明顯採取搶市佔策略,Kimi K2.5 的價格大幅下調,直接對標美國大型 AI 實驗室,也比前一代 K2 Turbo 便宜許多。目前最新價格為:輸入每 100 萬 token 只要 0.6 美元,降幅接近 48%;快取輸入則降到 0.1 美元,便宜約三分之一;輸出價格更是下殺到每 100 萬 token 3 美元,降幅超過六成。

其中,快取輸入的低價對代理集群功能特別關鍵。這類應用往往需要同時維持多個子代理的大型上下文內容,並頻繁呼叫各種工具,資料量非常龐大。低成本的快取機制,有助企業在大規模部署 AI 代理時,大幅降低整體運算與營運成本。

在開源授權方面,Kimi K2.5 雖然對外開放原始碼,但採用的是「修改版 MIT 授權」(Modified MIT License),並非完全無限制使用,而是針對大型商業平台設下門檻。這樣的設計,等於讓多數開發者與新創公司都能免費使用模型,同時防止大型科技公司「貼牌使用」Moonshot 的技術卻不標註來源。整體來看,這種授權方式雖然不算完全開源,但仍比 Meta 的 Llama 授權條款寬鬆。

《Bloomberg》指出,DeepSeek 的 R1 在 2025 年初爆紅後,中國模型圈曾一度出現「百模大戰」,但不少小玩家因技術與資金跟不上而被淘汰,近期又出現一波融資與上市潮:Zhipu、MiniMax 等在香港 IPO,Moonshot 也在上月傳出完成新一輪融資,並隨即啟動新一輪募資,估值上看 50 億美元。

對 Moonshot 而言,K2.5 與 Kimi Code 的組合,既是技術競賽,也是商業路線的加速器:一方面用更便宜的 API 拉動開發者採用,另一方面,用 Kimi Code 切入 AI 寫程式工具的競賽,試圖把模型能力直接變成可付費、可黏著、可擴散的產品形態。

立即報名 3/3「AI 智慧大工廠」論壇台北場,解密 Agentic AI 如何重塑「超自動化」工廠

*本文開放合作夥伴轉載,資料來源:《Bloomberg》《VentureBeat》《winbuzzer》,首圖來源:Kimi.ai

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

網傳「白銀存摺全攻略」 台銀急發聲明澄清

太報
02

訂單翻倍仍裁員 ASML將開除1700人「瘦身」!多為荷蘭、美國管理層

太報
03

聯準會》鮑爾宣布利率按兵不動 對繼任者建議 :不要從政

信傳媒
04

郭台銘長女郭曉玲一出手就是2億 向中華車訂製逾200輛車來做公益

鏡週刊
05

台灣傳產快看!這大廠成功「老牛翻身」獲60億美元大單 謝金河:給台廠的啓示

風傳媒
06

能比台積電更快站上2000元?大摩點名台灣這間科技大廠 最新目標價2088元

風傳媒
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...