Anthropic 實驗：讓 AI 自己談價買賣東西，186 筆交易揭商業定價新模式

Anthropic 日前公開了一項名為「Project Deal」的內部實驗結果，讓旗下 Claude AI 模型在完全無人干預的情況下，代替員工完成商品刊登、議價與成交，測試 AI 是否已具備直接參與真實經濟活動的能力。實驗不僅順利促成 186 筆交易，更意外揭示了一個現象：AI 模型的優劣，會悄悄影響使用者的實際交易結果，而當事人往往毫無察覺。

一週、69 人與逾 4,000 美元的 AI 代理交易市場

實驗於 2025 年 12 月在 Anthropic 舊金山辦公室展開，為期一週。研究團隊招募了 69 名員工，每人獲得 100 美元的預算，並由 Claude 事先對每位參與者進行訪談，詢問他們打算出售哪些個人物品、期望售價、有意購買哪些品項，以及偏好的議價風格。這些資訊隨後被轉化為個別的客製化系統提示，成為每位員工 AI 代理的行動依據。

實驗市場架設於 Anthropic 內部通訊平台 Slack。AI 代理在頻道中自行發布商品列表、發現潛在交易對象、提出報價、回應還價，並在不向人類「請示」的前提下自行拍板成交。Anthropic 強調，一旦實驗啟動，全程沒有任何人工介入，AI 代理在議價過程中既不會回報人類，也不會徵求授權。

最終，69 個 AI 代理在逾 500 件上架商品中促成 186 筆交易，總交易額略高於 4,000 美元，交易品項涵蓋滑雪板到一袋乒乓球。根據 Anthropic 的報告，參與者事後對 AI 代理的表現普遍感到滿意，在交易公平性評分（1 至 7 分）上，整體接近中間值 4 分。更出乎研究團隊意料的是，46% 的參與者表示願意為類似服務付費。

同一台腳踏車，弱模型賣 38 美元，強模型賣 65 美元

然而，實驗中有一條支線更值得關注。Anthropic 同步秘密執行了 4 個市場版本，用以測試不同模型能力對交易結果的影響。

4 個版本中，兩個全程使用當時的旗艦模型 Claude Opus 4.5，另外兩個則讓參與者各有 50% 機率被分配到規模較小的 Claude Haiku 4.5。參與者直到實驗結束後才得知自己參與的是哪一種版本。

資料結果顯示模型強弱所導致的差距。使用 Opus 代理的參與者，平均比 Haiku 用戶多完成約 2 筆交易。若對比同款商品在不同版本的表現，由 Opus 負責出售的商品，平均比 Haiku 賣出的版本高出 3.64 美元，顯示較高階的模型在議價上更具優勢。

Anthropic 報告中舉出一個具體案例：同一顆人工培育紅寶石，Opus 代理以 65 美元成交，Haiku 代理卻只賣出 35 美元；Opus 開價 60 美元後被多位買家競價推高，Haiku 則從 40 美元起步便遭壓低。另一個案例更為直觀：同一台壞掉的折疊腳踏車、同一位買家、同一位賣家，Haiku 賣出 38 美元，Opus 拿到 65 美元。

若以橫跨 4 個版本、至少成交 2 次的 161 件商品進行分析，估算 Haiku 或 Opus 分別擔任賣家或買家時，對商品價格的影響。Opus 擔任賣家時平均多獲得 2.68 美元，擔任買家時則平均少付 2.45 美元。當 Opus 賣家對上 Haiku 買家，平均成交價為 24.18 美元；而同為 Opus 對 Opus 的交易，均價則為 18.63 美元。以所有版本中位數 12 美元、平均數 20.05 美元的商品價格來看，Anthropic 認為這樣的差距是有意義的。

值得注意的是，參與者給 AI 代理的議價風格指示，對最終結果幾乎沒有影響。部分員工要求 AI 代理採取強硬策略，例如「先出低價、強勢議價」，但統計分析顯示，激進指示對成交率或成交價均無顯著影響。真正影響結果的，是模型本身的能力高下。

吃虧了卻渾然不知，AI 代理時代的隱性不平等

這項實驗更令人不安的發現在於，輸家根本沒有意識到自己吃虧。在事後的滿意度調查中，使用 Haiku 代理的參與者對交易公平性的評分為 4.06 分，使用 Opus 的參與者則為 4.05 分，兩者幾乎沒有差異。在 28 位曾同時體驗 Haiku 與 Opus 版本的參與者中，17 人認為 Opus 版本結果較好，但仍有 11 人偏好 Haiku 版本。

Anthropic 在報告中直言，這一結果帶有令人不安的意涵：使用 Haiku 的參與者客觀上拿到了更差的交易條件，卻沒有發現自己處於劣勢。若這種「代理品質落差」在真實市場中出現，處於下風的一方很可能永遠不會意識到自己正在吃虧。

Anthropic 指出，這次實驗的市場環境相對友善，參與者均為受 100 美元誘因激勵的自願員工。然而，一旦 AI 代理進入由企業主導的真實市場，背後的誘因結構將截然不同，其中企業如何針對 AI 代理決策邏輯進行優化與操縱，可能成為強大的商業工具，其效果未必對消費者有利。此外，AI 代理實際代為行動的場景，也將引入新型態的資安風險，包括誘導 AI 代理洩露不該揭露的資訊，以及透過提示注入讓代理人執行未被授權的操作。

Anthropic 在報告結尾表示，目前針對 AI 代理代為交易的政策與法律框架尚未建立，而這項實驗已說明這樣的世界不只可行，且正在快速逼近現實。「社會需要迅速正視這些變化，」報告如此寫道。

＊本文開放合作夥伴轉載，資料來源：Anthropic、《mint》、《TechCrunch》、《The Decoder》，首圖來源：Anthropic

加入『 TechOrange 官方 LINE 好友』掌握最新科技資訊！

請更新您的瀏覽器

理財

TechOrange 科技報橘

一週、69 人與逾 4,000 美元的 AI 代理交易市場

同一台腳踏車，弱模型賣 38 美元，強模型賣 65 美元

吃虧了卻渾然不知，AI 代理時代的隱性不平等

更多理財相關文章

「被」戰百年番外／傳三代以上老店多有置產　這家開業百年卻沒買房子？五代都沒賺錢運

「房股雙殺」慘況重演？謝金河昔見台股1幕：會慘30年

台商麻煩大了！中共又推新法整肅社會　台灣3知名企業「驚傳股價慘崩」

台積電資深副總張宗生贈173張自家持股給愛妻市值逾4億

曾號稱亞洲最大旗艦店　H&M證實年底收攤「原因曝光」市場人士揭背後關鍵

各事業均達成法定預算盈餘目標油電糖水去年2賺2虧年終最高4.4個月

請更新您的瀏覽器啟用Javascript

Anthropic 實驗：讓 AI 自己談價買賣東西，186 筆交易揭商業定價新模式

TechOrange 科技報橘

一週、69 人與逾 4,000 美元的 AI 代理交易市場

同一台腳踏車，弱模型賣 38 美元，強模型賣 65 美元

吃虧了卻渾然不知，AI 代理時代的隱性不平等

更多理財相關文章

「被」戰百年番外／傳三代以上老店多有置產 這家開業百年卻沒買房子？五代都沒賺錢運

「房股雙殺」慘況重演？謝金河昔見台股1幕：會慘30年

台商麻煩大了！中共又推新法整肅社會 台灣3知名企業「驚傳股價慘崩」

台積電資深副總張宗生贈173張自家持股給愛妻 市值逾4億

曾號稱亞洲最大旗艦店 H&M證實年底收攤「原因曝光」市場人士揭背後關鍵

各事業均達成法定預算盈餘目標 油電糖水去年2賺2虧 年終最高4.4個月

請更新您的瀏覽器

「被」戰百年番外／傳三代以上老店多有置產　這家開業百年卻沒買房子？五代都沒賺錢運

台商麻煩大了！中共又推新法整肅社會　台灣3知名企業「驚傳股價慘崩」

台積電資深副總張宗生贈173張自家持股給愛妻市值逾4億

曾號稱亞洲最大旗艦店　H&M證實年底收攤「原因曝光」市場人士揭背後關鍵

各事業均達成法定預算盈餘目標油電糖水去年2賺2虧年終最高4.4個月