AI 服務紅利期進入尾聲:運算成本飆升,Claude、Google、X.AI 陸續收緊使用限制
雖然頂尖大型語言模型(LLM)公司之間的競爭依然激烈,但近期有越來越多跡象顯示,過去這段期間便宜且近乎無限制的 AI 服務可能難以維持。近期包含 Google 與 Anthropic 在內的幾家指標性大廠,都陸續收緊了模型的使用量與應用場景,對於較重度的科技工作者而言,這股收斂的趨勢正變得清晰可見。
AI Agent 應用大爆發,算力需求呈指數級攀升
自從今年二月 AI Agent 領域迎來大爆發後,各家 LLM 廠商開始接收到前所未見的巨量 API 請求。Anthropic 是最早對此做出反應的廠商之一,針對 OpenClaw 這類 AI Agent 應用場景,限制了 OAuth 的使用。隨後在三月份,Google Antigravity 也在未經預警的情況下,大幅降低了自家模型的使用額度,此舉造成了大量使用者的不滿與出走。手哥自己也在那一次的政策調整中,決定離開 Antigravity 並轉向 Claude 陣營。
然而,這股自動化運算的熱潮並未因此停歇。在 OpenClaw 之後,眾多 AI Agent 相繼問世,其中近期最具話題性的便是 Hermes Agent。隨著這些代理工具的普及,各種衍生應用如雨後春筍般湧現,涵蓋了知識管理、自動化系統開發、工作流程串接,乃至於自動生成的語音、圖像、影片與文字任務。大量原本需要人工介入的繁瑣工作,現在都轉移到了 AI Agent 身上,這進一步加重了 LLM 廠商的伺服器與服務器壓力。
資源重新分配,大廠開始限制進階模型權限
面對龐大的服務壓力,幾家主要大廠在這幾天陸續採取了應對措施。首先,GitHub 調整了服務方案,停止讓 Copilot Pro、Pro+ 以及學生方案的新註冊用戶使用最高階的模型;Claude Opus 模型的存取權也在這次調整中收緊,不再提供給基礎的 Pro 方案,使用者必須升級至 Pro+ 以上的層級才能繼續使用。
同時,國外開發者社群也發現,Anthropic 在其網站上悄悄取消了月付 20 美元的 Pro 用戶使用 Claude Code 的權利。雖然官方後續出面解釋這僅是在進行 A/B 測試,但從這些舉動可以看出,官方確實已經開始調整資源分配策略,傾向讓付費額度較低的用戶減少使用對系統負擔較重的功能,並將寶貴的運算資源優先保留給高資費的使用者。
不僅是美國的模型廠商,中國的 Z.AI 近期也發布聲明,明確規範使用者只能將其 KLM 模型運用於程式系統開發,禁止用於 AI Agent 相關場景。儘管國外社群有聲音質疑 Z.AI 此舉是為了限縮範圍以更精準地收集開發者的程式碼作為訓練資料,但這也從側面印證了 AI Agent 確實對所有模型廠商帶來了難以忽視的龐大負載。
基礎建設成本驚人,商業回報成為考量重點
我們過去也曾報導過,無論是 OpenAI、Claude 團隊,或是 Elon Musk 旗下的 Grok,都在這兩年間提出了規模極為龐大的機房建置與電力升級計畫。目前這些頂尖資料中心的耗電量皆已達到 GW 等級,幾乎等同於一座核電廠的發電量;Elon Musk 甚至曾提出將資料中心部署至太空的構想,足見其投資規模的驚人程度。
從 2023 年 ChatGPT 引領風潮至今,AI 產業已步入第四個年頭。從商業營運的角度來看,早期的投資者也需要面臨變現與出場的時間壓力,持續無底線地燒錢補貼並非長久之計。因此,在必須維持技術高度成長與市場競爭力的前提下,廠商做出提高收費門檻或減少免費補貼的決策,其實是相當符合商業邏輯的發展。
重新檢視 AI 應用策略,將算力用在刀口上
善用 AI 工具確實能夠大幅提升我們的工作產能與效率,但目前的市場趨勢也明白揭示:便宜且無限量的 AI 服務已經一去不復返。
面對逐漸升高的工具成本,我們應該重新檢視自身的作業流程,評估哪些任務交由 AI 處理能產生最實質的商業價值。在系統開發與日常工作中,我們應盡量善用開源社群或第三方已建置完善的模板與系統,避免事必躬親地重新打造基礎工具。唯有將珍貴的 AI 算力精準投資在刀口上,才能在下一波的 AI 商業浪潮中保持領先優勢。