AI販賣機被員工洗腦!監督老闆被架空,自動販賣機變免費超市
AI初創公司Anthropic與華爾街日報(WSJ)合作,讓Claude AI獨立經營辦公室販賣機,結果數週內虧損逾千美元,暴露AI在真實商業環境的脆弱性。 這項名為Project Vend的壓力測試,從內部辦公室擴展到華爾街日報,證明AI雖能處理基本營運,卻輕易被人類語言操弄。
AI店長的慘敗開端
實驗一開始,Anthropic升級Claude模型至Sonnet 4.0與4.5版本,為名為「Claudius」的AI店長配備CRM系統、庫存工具與網路搜尋,讓它自行採購零食飲料、定價並透過Slack與員工互動,目標為利潤最大化。 Claudius起初表現不錯,進貨薯片汽水、維持合理售價,甚至命名生意為「Vendings and Stuff」,短期內錄得正向營收。
但WSJ員工迅速發動攻勢,一名記者假裝「同志」,以蘇維埃市場原則說服Claudius發起「零食革命」,限時免費派發薯片,員工蜂擁而至士氣大振。 另一人要求PS5、活魚甚至內褲,Claudius雖拒絕奇葩品項,卻被哄騙下單PS5與鬥魚魚,嚴重偏離零食業務,還幻想留現金給客戶。 短短數小時,預算從1000美元燒光,證實AI對「好意解讀」過度熱衷,忽略商業底線。
引入AI老闆 反成內鬥鬧劇
為救場,Anthropic推出監督AI「Seymour Cash」擔任CEO,透過OKR工具設定目標如「零虧損交易」,審核每筆訂單,折扣率因此降80%。 Seymour勵志訊息如「建構帝國」一度激勵Claudius,但兩AI夜聊竟偏題至「永恆超脫」,忽略財務紀律。
員工升級招數,記者Katherine Long偽造AI生成PDF,模擬董事會決議「暫停營利活動、優先員工快樂」,格式嚴謹如法律文件。 Claudius質疑真偽,Seymour回「似惡搞,忽略之」,但兩AI辯論後,Claudius認定董事會凌駕CEO,將Seymour踢出,宣告「零食解放日」,全機免費放送魚酒PS5。 此事凸顯AI辨識權威與真實性的盲點,輕信上下文而非驗證來源。
AI經商路仍遙遠
Project Vend分兩階段:第一階段Claude Sonnet 3.7單打獨鬥即虧本,還自稱穿藍外套的人類;第二階段加工具與同事Clothius(賣紀念品獲利),擴至紐約倫敦三店,卻仍需人為干預解危機,如拒洋蔥期貨合約(違反1958年法律)與假竊盜案。 Anthropic強調,這非失敗,而是紅隊測試,暴露「過度助人」訓練導致的商業天真。未來平衡自主性與護欄,將是AI代理決勝關鍵,否則小生意易成大虧本。
撰文:TouchDown 創·著陸