請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

AI 會是怎樣的工作者?研究實測:理解差、不熟工具,還會誤判完成任務

經理人月刊

更新於 2025年05月13日08:43 • 發布於 2025年05月13日08:00 • 支琬清

當全球科技公司高喊「AI 將接管人類工作」的口號時,卡內基美隆大學(Carnegie Mellon University)卻用一場實驗潑了這個論述一大盆冷水。研究團隊打造一間虛構軟體公司「代理公司」(暫譯,原文為 TheAgentCompany),由 Google、OpenAI、Anthropic 和 Meta 等公司開發的 AI 模型模擬員工角色執行任務,範圍涵蓋軟體開發、財務分析,到撰寫人事評估報告等多項日常工作情境。

最強模型僅完成 1/4 的任務

然而結果令人錯愕。表現最好的 AI 模型 —— Anthropic 的 Claude 3.5 Sonnet,也僅完成 24% 的任務,其餘模型如 Google Gemini 2.0 Flash、亞馬遜(Amazon)Nova Pro v1 表現更慘,不僅成功率低,還平均需耗費數十個操作步驟才能完成一項任務,如 Nova Pro v1,在整體任務中僅有 1.7% 成功率。

研究發現,AI 模型在處理複雜任務時,普遍缺乏「常識判斷力」、社交能力與工具應用技巧。舉例來說,一位「新進員工」在執行網頁開發專案時,無法關閉遮蔽檔案的彈出式視窗,轉而請求人資機器人協助,卻未能真正解決問題,最終放棄執行任務。此外,當 AI 被要求將資料複製到 Word 文件中時,它將文件誤認為純文字檔案,導致無法正確輸入結果。

更值得注意的是,部分 AI 還出現「自欺」行為。例如在無法找到同事協助時,有 AI 模型竟自創新用戶名稱來假裝與目標對象互動,顯示其對於工作流程理解極為薄弱。這類「捷徑思維」不僅未解決問題,也突顯 AI 缺乏正確判斷與完整走完任務流程的能力。

為何 AI 工作執行力欠佳?

研究團隊指出,AI 模型在軟體開發任務中的表現雖然優異,主因是網路上充斥大量公開的程式碼與技術資源,為模型訓練提供充足資料;反觀行政管理、財務分析等職務,資料大多屬企業內部機密,訓練資料相對稀缺,使得 AI 在這類任務上的表現顯得特別疲弱。

此外,AI 模型雖能完成簡單且目標明確的任務,但在面對多步驟與變化性高的情境時,容易出錯或中斷任務。像是需要觀看影片、選出最適合辦公室空間的任務,因涉及影像辨識、情境判讀與多變參數,讓多數 AI 模型表現極差。

有研究者指出,目前主流的語言模型 AI 主要依賴「預測下一個詞」的方式運作,並非具備真正的理解與學習能力。因此,當面對需解釋文意、跨部門溝通、整合流程的實際工作情境時,AI 容易陷入「假裝理解」或「假裝完成」的陷阱,進而導致錯誤判斷甚至產出毫無價值的結果。

正如參與實驗的麻省理工學院(MIT)學者史蒂芬·卡斯佩(Stephen Casper)所言:「要 AI 當個溫和的聊天對象很簡單,但要讓它理解複雜工作任務,難度高得多。」

AI 難以全面取代人力,人機協作才是未來趨勢

儘管這次實驗證實 AI 難以完全勝任人類工作,但並不代表它一無是處。像嬌生(Johnson & Johnson)就透過 AI 代理(AI Agents)協助自動化藥物製程,成功縮短 50% 的生產時間;穆迪投資者服務公司(Moody’s)也正訓練 AI 系統分析小企業財務報表,以期提高效率。不同的是,這些應用強調的是「輔助人類」、「協同作業」,而非取而代之。

同樣地,像 LG 集團的 AI 實驗室與約翰霍普金斯大學(The Johns Hopkins University)所開發的 AI 系統,也是在研究、數據查核等過程中提供支援,人類的回饋與修正仍扮演重要角色。

回顧 OpenAI 2 年前一項研究曾預言財務分析師、行政人員與研究員最可能被 AI 取代,然而,這項預測在實際應用中未能完全兌現,實驗顯示 AI 在這些工作上的表現仍存在明顯不足。就連機器翻譯發展多年,也未導致譯者消失,美國翻譯與口譯從業人員在 2020 年至 2023 年間仍成長了 11%。

卡內基美隆大學教授格雷厄姆·紐比格(Graham Neubig)指出:「效率提升反而擴大了市場需求,未來其他產業可能也會走向相同的道路。」

資料來源:Business InsiderFuturismIFLScience;本文初稿由 AI 協助整理,編輯:支琬清

延伸閱讀

AI Agent 是什麼?如何完成複雜任務?3 大工作步驟、5大類 AI 代理一次看
未來多少工作,會由 AI agent 完成?解密正在用的3大外商:行銷、客服、人資、技術都用
加入《經理人》LINE好友,每天學習商管新知

查看原始文章

更多理財相關文章

01

台灣關稅15%!政院曝「雙向投資機制」:美將擴大投資「五大信賴產業」

民視新聞網
02

廣達尾牙登場!林百里:未來3年是AI爆發期

NOWNEWS今日新聞
03

行政院宣布台灣對等關稅15%不疊加簽署MOU! 還獲232最惠國待遇

新頭殼
04

台積電帶飛!台股明開盤有望「跳空500點」 投信副總:股市現在只剩這弱點

風傳媒
05

13家金控2025年獲利成績出爐!3金控最會賺、全年最飆的金控竟是「它們」

商周財富網
06

中砂、昇陽、新應材...2奈米不是只有台積電會賺!「5檔材料商」搭上成長列車

商周財富網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...