請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

AI 可以當很好的聊天對象,研究:當員工就免了

科技新報

更新於 2025年04月23日14:55 • 發布於 2025年04月23日12:29

最近愈來愈多人加入ChatGPT 行列,甚至有人用到有感情,只要用過就離不開它,更可能成為一般人的最佳助理,老闆的最佳員工,但目前這個願景可能有點難達成,卡內基美隆大學 (Carnegie Mellon University) 實驗,打臉AI 取代人類員工假設,AI 時代只會更需要人類員工。

AI 未來很容易想像,不是只像聊天機器人執行一次性指令,而能獨立代表個人行事,做出決策,且幾乎不需干預,在陌生環境執行任務,譬如想買吸塵器,有智慧的AI 理論上可幫忙挑選甚至下單。企業也一樣期待AI 能耐,Google、亞馬遜、OpenAI 和其他主要科技公司競相打造AI 代理。

德勤調查超過2,500 名高階主管,超過 25% 表示正在「大規模或非常大規模」探索 AI 代理。Salesforce 執行長曾說,今天執行長將領導最後一批全人類勞動力。Nvidia 黃仁勳也預測,每家公司IT 部門很快都會「成為AI 代理的人力資源部門」。OpenAI CEO Sam Altman 表示,今年AI 代理商將「加入勞動力大軍」。

兩年前,OpenAI 發布一項引起廣泛討論的研究報告,稱金融分析師、管理人員和研究人員等職業最有可能被取代。但目前還不清楚,這些AI 代理到底有多厲害。

AI 無法處理複雜任務

卡內基美隆大學電腦科學家Graham Neubig 等人做一場實驗,模仿一家小型軟體公司的布局,包括內部網站、類似Slack 的聊天程式、員工手冊以及可以聯繫的虛擬 HR 經理和技術長,AI 代理可以瀏覽網頁、編寫程式、在電子表格中組織資訊,以及與同事溝通。研究人員指示Google、OpenAI、Anthropic 和Meta 的 AI 模型來完成真實員工在金融、行政和軟體工程等領域可能執行的任務。

AI 必須完成不同任務,譬如AI 必須瀏覽多個文件來分析咖啡連鎖店的資料庫。在另一個測試中,AI 被要求收集一位36 歲工程師的回饋並撰寫績效評估。另一項任務要求AI 觀看未來新辦公空間的影片導覽,選擇擁有最佳醫療設施的辦公空間。

結果並不理想,表現最好的模型,Anthropic 的Claude 3.5 Sonnet 只完成不到四分之一的任務。其餘包括 Google 的 Gemini 2.0 Flash 和支援 ChatGPT 的 Flash,只完成約 10% 的工作。

一開始AI 代理表現不錯,但隨著任務變得越來越複雜,由於缺乏常識、社交技能或技術能力而遇到問題,AI 也經常誤解與同事的對話,或不遵循關鍵指示,任務標記為完成實際上根本沒做完等等。結論是,AI 無法勝任多層次的工作。

其他研究也發現,AI 還不能靈活應對不斷變化的環境,另一項研究發現,當工具和指令太多時,AI 很難達到人類的水平。研究人員認為,雖然代理可以用來加速人類員工正在執行的某些任務,但它們目前可能無法取代所有任務。

研究人員直言,教導AI 成為良好的對話夥伴相對容易,因此大多數最先進的AI 系統都是不錯的聊天機器人,但很難教會它們做人類員工能做的一切事情。

連翻譯都無法取代

AI 至今的發展與當初想像的不同,以翻譯市場為先例,雖然機器語言翻譯已經很普及且準確,原本以為人類翻譯工作會消失,但在美國,從事該行業的人數仍然保持相當穩定。NPR 對人口普查局數據的分析發現,2020 年至2023 年間,口譯員和筆譯員的數量增加11%,美國勞工統計局預測,未來十年口譯員和翻譯員的職位數量將增加約4%。

Neubig 表示,任何效率的提高都會導致需求增加,擴大語言服務市場的總規模,AI 對其他領域的影響也將遵循類似的軌跡。研究AI 的麻省理工學院經濟學家 Daron Acemoglu 更坦白,他說AI 的優秀程度常常被誇大,「在幾乎所有事情上,它最多只能幫助人類,最壞的情況是,甚至連幫助人類都做不到。」

(首圖來源:Unsplash)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

中東局勢引爆賣壓 台股下殺盤中跌逾700點

中央通訊社
02

美股漲跌互見 台股盤中翻黑跌逾700點摜破5日線!貨櫃三雄股價續揚

太報
03

蘋果新機 iPhone 17e 突襲發表!儲存空間上看 256GB、支援 MagSafe

自由電子報
04

台灣1行動支付傳倒閉!多名用戶錢領不出 官方回應了

CTWANT
05

震撼!卡達停產天然氣 經濟部成立應變小組

太報
06

存摺太久沒補登會怎樣? 郵局行員揭「隱藏用途」:除了存摺之外無解

鏡報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

留言 1

留言功能已停止提供服務。試試全新的「引用」功能來留下你的想法。

Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...