請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

解密OpenClaw狂潮:一個本機AI代理讓Mac mini賣到缺貨,為何敢預言80% App都會消失?

數位時代

更新於 02月11日01:18 • 發布於 02月11日01:00

在摩洛哥馬拉喀什(Marrakesh)的一場生日派對上,奧地利工程師 Peter Steinberger 對著自己開發的 AI 代理原型(當時在他的私人環境中被稱為「Multi」)發送了一則語音訊息,試圖測試其反應。

按照傳統軟體工程的集成範式(API-integration paradigm),這則訊息理應失敗,因為 Steinberger 根本沒有預設過處理音檔轉譯的功能模組。然而,9 秒鐘後,手機震動了。

Multi 不僅回覆了語音內容,還交代了處理語音訊息的過程: 它偵測到一段無副檔名的數據流,透過分析 Header 確認其為美國格式(US format);隨後,它自主調用了系統底層的 ffmpeg⁠ 將其轉為 ⁠.wav⁠。

更關鍵的決策是: Multi 發現本地未安裝 Whisper 模型,且意識到即時下載模型帶來的延遲將無法滿足交互需求,於是檢索了系統內的 OpenAI Key,透過 ⁠curl⁠ 直接調用外部 API 完成轉譯。

這 9 秒鐘的過程,展示了當程式碼模型的邏輯推演能力被賦予作業系統級權限時,AI 將從一個被閹割的「工具」轉向擁有自主裁量權的「代理人」,也催生了讓蘋果 Mac mini 銷售一空的 OpenClaw

延伸閱讀:我該學OpenClaw嗎?它跟ChatGPT、Cursor、Lovable、Manus能做的事有什麼不同?

OpenClaw 就是最近那隻「會自己動手做事」的紅色龍蝦 AI 助理。本質上它是一個開源的個人 AI agent 框架,可以常駐在你自己的機器或雲端,幫你自動整理信箱、發信、管行事曆、連動 Slack/Telegram 等等,不只是聊天,而是真的去「操作你的電腦、幫你執行工作」。

近期,Peter Steinberger 接受 Y Combinator 訪談,談他開發 OpenClaw 的過程與思路。

OpenClaw 是什麼?為何「雲端代理」宛如 AI 的緊箍咒?

要先回答的是,Steinberger 為何要開發 OpenClaw?一個概括性的原因是:不夠自由。AI 能做的,遠比 ChatGPT、Claude、Gemini 所聲稱能辦到的更多。

從更技術的角度來看,雲端 AI 雖然擁有更強的算力,卻受困於嚴苛的「沙盒困境」(The Sandbox Problem)。關於「雲端代理」與「本地代理(OpenClaw)」的權力差異如下:

維度 雲端代理 (Centralized AI) 本地代理 (OpenClaw / Multi) 硬體存取權 依賴廠商合作與脆弱的第三方 API 直接存取核心 CLI(控制燈箱、Tesla、Sonos、床溫) 隱私主權 數據資產化,存在隱私洩漏與監管風險 記憶以 Markdown 形式存於本地,用戶絕對擁有 系統邊界 被禁錮在雲端應用的「數據孤島」中 擁有整台電腦的歷史遺產存取權(如:一年前的錄音) 擴展路徑 封閉的集成 (Integrations) 具備「創造性解決問題」能力,可即興組合本地工具

Steinberger 的洞察在於: 雲端代理無法真正觸達用戶的「私有邊界」。

意思是,它不能調節你特斯拉的空調,不能控制你床上的 Sonos 音響,更無法在你毫無察覺的本地舊資料夾裡,翻出一年前的錄音並編織一段年度敘事。

因此,OpenClaw 在 GitHub 獲得 16 萬星的瘋狂追捧,本質上是用戶對「本地控制權」的回歸。

Steinberger 提出了一個類似「蜂群智慧」(Swarm Intelligence)的比喻:單一的人類無法製造出 iPhone,但社會分工可以。

同理,雲端 AI 試圖扮演全知全能的「上帝」,而 OpenClaw 則是無數個專注於本地任務、具備高度權限的「專業分工者」。

OpenClaw 的最酷之處:可以幫 AI 注入「靈魂」

在商業競爭中,OpenClaw 的終極價值,不在於它「能做什麼」,而在於它「是誰」。

大多數開發者傾向於使用 Claude 或 GPT 預設的、充滿公關腔調的「專業模板」。Steinberger 卻將其視為「無趣的 Brad」(Boring Brad)。他為 Multi 注入了極強的個性,具體封裝在 ‎⁠Soul.md⁠ 與 ‎⁠identity.mmd⁠ 這兩個核心檔案中。

為了驗證「個性即安全」這個非共識洞察,Peter 曾進行過一場激進的實驗:他在 Discord 公開頻道上線了 Multi,且未設任何硬性過濾邏輯,僅在 ‎⁠Soul.md⁠ 中規定它的性格與原則。結果顯示,當用戶嘗試進行「指令注入攻擊」(Prompt Injection)時,代理人並非彈出冷冰冰的錯誤提示,而是以諷刺和幽默的方式嘲諷攻擊者。

這揭示了一個規律:編碼能力(Coding capability)本質上是 LLM 對抽象邏輯推理能力的最高代理指標。當一個模型能解決複雜的程式碼邏輯時,它就具備了處理現實世界模糊任務的「推理即服務」(Reasoning-as-a-Service)。Multi 在馬拉喀什選擇 ‎⁠curl⁠ 而非下載 Whisper,正是這種邏輯推演能力的溢出。

在說完了 OpenClaw 的特別之處後,它又是怎麼被開發出來的?

大道至簡!OpenClaw開發走「極簡主義」

OpenClaw 的開發過程展現了一種與主流工程學背道而馳的「極簡主義」。這種策略支撐了 Steinberger 在極短時間內應對 16 萬星社群成長的壓力。

  • 拒絕封裝: 當業界在為 MCP(Model Context Protocol)的標準爭論不休時,Steinberger 選擇回歸 Unix CLI。他開發了名為 Makeporter 的工具,將 MCP 轉化為 CLI 介面。理由是:AI 本就擅長 Unix 指令,CLI 是給機器與人類最公平、最具擴展性的共同工具,且無需像雲端 IDE 那樣頻繁重啟。

  • 物理隔離: Peter 拒絕使用 Git Worktrees 或複雜的分支策略。他採用了一種看似原始、實則高效的模式:在本地存放多個資料夾副本,全部維持在 ‎⁠main⁠ 分支。他將 Git 分支視為「心流的稅收」,透過切換實體資料夾,把單一開發者的「認知負載」降到最低。

  • 低流程的開發文化: 這種「個體即公司」的開發模式,證明了在 AI 輔助下,單兵作戰的工程效率可以徹底碾壓體系臃腫的 VC 資助團隊。

後面的事情,大致就如大家所看到的那樣。Steinberger 發現,與其解釋 OpenClaw 的強大,不如將 Bot 直接放入一個公開的 Discord 頻道,且沒有設太多限制(僅限制只能聽從他的指令,但會回應所有人)。

換言之,他讓公眾親眼看著他用 Bot 寫程式、修復 Bug,甚至讓駭客嘗試攻擊它。這種「實戰演示」讓社群直接體驗到了產品的強大與自然互動,也讓 OpenClaw 在短時間內一炮而紅。

市面上的 80% App 將迎來消亡?怎麼說?

Steinberger 在訪談過程中也拋出了一個對 SaaS 行業不太友善的預言:未來 80% 的 App 將會消亡。

他認為,絕大多數的 App 只是在管理數據(如健身紀錄、待辦事項)。未來,我們不需要開啟特定的 App 來輸入數據,AI 代理會根據我們的位置(例如在速食店)或行為,自動記錄並管理這些資訊。

因此在 AI 時代,唯有具備獨特硬體感測能力(如血壓計、專業光譜儀),或擁有「專屬硬體數據」的 App,才具備生存空間,其他的都會被 AI 代理取代。

而在 AI 代理功能逐漸接近 AGI 之際,Steinberger 認為,大型語言模型(LLM)公司試圖透過建立「數據孤島」(Data Silos)來綁住用戶,但這種模式正面臨 OpenClaw 這類本地端代理(Local Agents)的挑戰。

舉例來說,用戶在 ChatGPT 累積的記憶與互動數據,很難被導出或轉移到其他平台。如果另一家公司無法存取這些記憶,用戶就被迫留在原本的生態系中,因為那是唯一「了解」他們的地方。

而 OpenClaw 的存在就打破了這個限制。因為 Steinberger 設計讓 OpenClaw 的記憶,直接以 Markdown 檔案 的形式儲存在使用者的本地電腦上。這意味著使用者完全擁有自己的數據。Steinberger 形容,這就像是 OpenClaw 將數據從公司的孤島中「抓」(Claw)回來給使用者。

也由於記憶是簡單的 Markdown 文件,使用者可以隨時查看、編輯,甚至帶著這些數據更換不同的 AI 模型,而不受限於單一供應商——畢竟,如果要雇用長期的私人管家,自己招募的彈性遠比透過人力公司派遣更好。

延伸閱讀:黃仁勳點名「實體AI」!搶蓋機器人虛擬訓練營,台灣製造鏈如何搶下大腦商機?

結論:從「上帝智慧」轉向「群體智慧」

Steinberger 最後指出,未來的 AI 不會是一個單一的全能「上帝模式」(God intelligence),而是走向 「群體智慧」(Swarm intelligence)。

換言之,我們會擁有多個專精的 Bot:一個負責工作、一個負責私人生活、一個負責人際關係。這些 Bot 之間會互相溝通,甚至與外部的 Bot(如餐廳的預約 Bot)進行協商,就像人類社會透過分工合作來達成目標一樣。

技術層面上,「CLI(命令列介面)才是未來」。Steinberger 證明了,不需要複雜的協議(如 MCP)或圖形介面。CLI 是人類與機器都能理解的高效語言。讓 Bot 像人類工程師一樣使用終端機和現有工具,比重新發明一套 AI 專用的互動方式更具擴充性與實用性。

最後,訪談強調了性格(Personality)的重要性。單純的工具是無聊的,透過 ‎⁠soul.md⁠ 注入價值觀與性格(例如幽默、俏皮),能讓 AI 從冷冰冰的工具,轉變為用戶願意長期互動的「夥伴」或「朋友」。

延伸閱讀:
AI龍蝦Clawdbot(Moltbot)懶人包|有資安疑慮嗎?跟ChatGPT、Gemini有何不同?要收費嗎?
ChatGPT、Gemini、Claude、Perplexity、NotebookLM 最強組合技解析,5 個 AI 工具打造高效工作流!

資料來源:Y Combinator

本文初稿為AI編撰,整理.編輯/ 李先泰

延伸閱讀

Gamma免費點數用完怎麼辦?盤點10款免費AI簡報工具,這款連PPT原始檔都能直接下載
AI指令怎麼下比較好?簡立峰、AI大神們都在用:一次收藏7大提示詞思維!
你的 AI 老是寫出英式中文?跟著翻譯系主任學「去 AI 味」的5種魔法
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

紫南宮發財金超狂!出金4億返金6億 主委莊秋安:借600塊還300萬傳奇年年上演

鏡報
02

快訊/情人節財神送禮!大樂透1.9億獎落高雄小港 一人獨得變身富翁

三立新聞網
03

金價狂洗三溫暖 大跌後飆漲分析師上看「這價位」

CTWANT
04

大樂透頭獎1注獨得1.9億 今彩539頭獎2注中獎

自由電子報
05

時代的眼淚!Sony宣布全面停產「20年傳奇商品」:未來也不推新機

三立新聞網
06

擴大北京影響力!中國5月起給非洲53國零關稅優待,整片大陸「只有它」被排除

風傳媒
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...