隨著科技快速進步,AI 風暴襲捲全球,預計 AI Agent 將會成為企業下一個追求的目標。AI Agent 又被稱為「AI 代理」,是能夠自主執行任務的人工智慧系統,擁有規劃目標、使用工具感知環境資訊,記憶並利用過去互動資訊來提升表現等核心功能。
AI Agent 是什麼?與一般傳統 AI 不同在哪?
與傳統 AI 通常需要輸入指令來完成特定任務相比, AI Agent 則可結合多種技術,包括大型語言模型(LLM)、工具呼叫、規劃和推理框架等,能自主決策、動態適應使用者需求並執行複雜工作流程。
AI Agent 的核心特點包含規劃能力,可根據使用者目標拆解任務,制定計劃並逐步執行;也可透過像是搜尋、計算等功能與工具補足知識;以及處理來自周遭環境的資訊,儲存過往的互動過程,並加以利用改進後續表現。
這些能力讓 AI Agent 不僅可以處理基本的行政任務,甚至能應用於旅行規劃、醫療診斷、緊急應變等場合,成為一名高效率的「數位同事」或「數位伴侶」。
AI Agent 是怎麼執行任務的?從 3 大工作階段看 AI Agent 如何運作
第一階段:目標設定與規劃
具體來說,AI Agent 是怎麼完成任務的?主要可分為 3 大工作階段:
第一階段為目標設定與規劃(Goal initialization and planning),AI Agent 雖然具備自主性,但一開始仍需要人類設定明確的目標和執行環境。針對相對複雜的任務,AI Agent 會將其拆解成許多個小任務,並制定具體的行動計畫;對於目標較簡單的任務,AI Agent 可以不進行事先規劃,而是直接透過反思和改進完成。
- 開發者:設計和訓練 AI Agent 系統。
- 部署者:提供使用者 AI Agent 的使用權限。
- 使用者:設定 AI Agent 需要完成的特定目標,並提供可使用的工具和資源。
舉例來說,假設使用者想要規劃一趟希臘衝浪之旅,希望 AI Agent 幫忙找出 2025 年最適合衝浪的周次。AI Agent 可能會這樣執行任務:
- 收集資訊:AI Agent 需要收集希臘的天氣資訊,例如潮汐、降雨量、日照等。
- 判斷衝浪條件:AI Agent 需要了解哪些天氣條件適合衝浪。
- 分析數據:AI Agent 需要分析收集到的天氣資訊,並預測明年哪個週次最符合衝浪條件。
第二階段:利用可用工具推理
然而,AI Agent 並非什麼事都知道。執行任務的過程中,AI Agent 可能會遇到自身知識庫不足的情況,此時 AI Agent 會使用外部工具來補充知識。
因此第二階段,是「利用可用工具推理」(Reasoning using available tools)。AI Agent 會使用外部工具如數據庫、API 及其他代理補充知識。根據外部工具提供的資訊更新自身知識庫,並調整計畫和自我修正,來提升後續表現。這個階段會透過多輪查詢、互動,加以整合新獲得的資訊來解決問題。
- 數據庫:AI Agent 能從數據庫中查詢相關資訊,例如產品資訊、客戶資料、歷史數據等。
- API:AI Agent 可以透過 API 呼叫其他服務,例如天氣預報、地圖導航、翻譯等。
- 其他代理:就像人類找其他領域的專家合作一樣,AI Agent 能與其他專精於特定領域的 AI Agent 合作,共同解決問題。例如負責規劃旅行的 AI Agent,能與負責預訂機票和飯店的 AI Agent 合作,提供更完善的服務。
第三階段:學習與反思
最後一個階段是學習與反思(Learning and reflection),AI Agent 會利用反思機制,整合來自其他 AI Agent 或人類的回饋意見,進一步提升目標和行動的精準性。使用者可以對 AI Agent 推薦的產品或服務提供評分或意見,幫助 AI Agent 學習和改進。
針對收到的回饋,AI Agent 會反思自身的決策過程、分析原因,找出可以改進的地方,並調整之後的執行策略,避免再次犯下同樣的錯誤。AI Agent 具備迭代優化(iterative refinement)與長期學習能力,可以將解決方案儲存於知識庫內。
以前面提到的希臘衝浪之旅為例,在第三個階段中,AI Agent 可能會這樣反思與改進:
- 收集使用者回饋:AI Agent 能詢問使用者是否滿意推薦的行程,並收集使用者對行程的意見和建議。
- 分析回饋資訊:AI Agent 分析使用者的回饋,了解哪些方面需要改進。像是使用者可能覺得行程安排太緊湊,或希望可以增加文化體驗的行程。
- 調整行程規劃:AI Agent 根據使用者的回饋調整行程規劃。例如可以將行程安排得更寬鬆,或者增加博物館、古蹟等文化體驗景點。
- 更新知識庫:AI Agent 會將調整後的行程規劃和使用者的回饋資訊,都儲存到知識庫中,未來規劃類似行程時會拿出來參考。
AI Agent 聰明嗎?厲害在哪?5 大類 AI Agent 一次看
根據功能與智慧程度,AI Agent 可分為 5 種主要類型:
基本反應型代理(Simple Reflex Agents)
只能根據當前感知的環境條件觸發固定的動作,不具備記憶功能,也無法處理未知情境。適用於完全可觀測且狀態單純的環境,依賴預先設定的規則,在特定條件下觸發特定動作。常見的用途像是智能恆溫器,可在設定的時間自動開啟供暖系統。
基於模型的反設型代理(Model-Based Reflex Agents)
可以記住先前的感知結果,並建立內部模型。 AI Agent 的行動,便仰賴內部模型的更新、預設的條件反應和當前狀態。與基本反應型代理相比,更具有彈性,能在部分可觀測的環境中運作。像是掃地機器人,能根據記憶中的房間布局模型調整行動,避免重複清理;自動駕駛汽車能根據感應器收集的路況資訊,建立周圍環境模型,做出駕駛決策。
目標導向型代理(Goal-Based Agents)
顧名思義,目標導向型代理具備「目標」的概念,能根據目標選擇適當的行動順序,透過計劃來尋找達成目標的最佳途徑,行動更具有靈活性, 也更適用於需要多步驟才能達成目標的情境。例如一般導航系統能根據當下的交通狀況,推薦最快到達目的地的路線。
效率型代理(Utility-Based Agents)
率型代理的 AI Agent 不僅以達成目標為目的,還會透過效率函數(utility function)計算最佳解。效率型代理會考慮效益、成本或完成時間等因素,選擇效用最大的行動,適用於需要在多個可行方案中選擇最佳方案的情境。例如高級導航系統可根據油耗、時間和過路費等因素計算出最優路線;資源分配系統能根據資源的效益和成本,決定最佳的資源分配方式。
學習型代理(Learning Agents)
學習型代理 擁有學習機制,能從經驗中改進性能,主要包含 4 個組成部分:學習、評論、執行和問題生成,可適應「未知環境」並持續提升能力。 舉例來說,電商推薦系統能根據用戶行為學習,提供更精準的商品推薦;垃圾郵件過濾器能根據郵件特徵學習,區分垃圾郵件和正常郵件。
一個 AI Agent,可以同時具備多種特徵!「多智能代理系統」又是什麼?
不同類型的 AI Agent 適用於不同的情境。簡單總結,基本反應型適合完全可觀測的環境,而效率型和學習型更能處理複雜或動態的問題,而學習型代理是最先進的類型,具有從環境中學習並持續改進的能力,特別適合個性化服務,例如推薦系統。
值得注意的是,這些類型並非互斥,一個 AI Agent 可以同時具備多種類型的特徵。例如一個導航系統可以是目標導向型代理,也可以同時也利用效率型代理的邏輯來計算最佳路徑;自動駕駛汽車可以是基於模型的反設型代理,也同時具備學習型代理的能力,不斷優化駕駛策略。
此外,由多個 AI Agent 組成的新型態 AI 系統「多智能代理系統」(Multi-Agent Systems),則進一步提升了 AI Agent 的效能,透過多個獨立代理的互動與協作,解決單一 AI Agent 無法應對的大規模或複雜問題。
多智能代理系統具備分散性、自主性、目標導向性與互動性的特點,適用於需要高可靠性與規模化解決方案的情境,也因此具備動態推理(Dynamic reasoning)、處理複雜問題的能力與增強記憶能力(Enhanced memory)等特點。像是在醫療領域,AI Agent 可協助制定治療計劃或管理藥物流程;而在自然災害應急中,它們可快速定位受災者,提供救援建議等。
未來 5~10 年,AI Agent 能完成人們 80% 的日常工作!那人類的價值在哪?
人工智慧招聘公司 Moonhub 創始人兼執行長 Nancy Xu 在世界經濟論壇(World Economic Forum)指出,未來 5~10 年,AI Agent 將能夠完成人們 80% 的日常工作時間,深刻改變人類的工作與生活模式。
試想一下,當 AI Agent 能完成多數的日常工作時,人類的價值會是什麼?AI Agent 的崛起,也迫使人們重新定義「什麼是獨特的人類勞動」。而 AI 與人類的協作,將進一步推動「AI 人才革命」,工作者需要學習更多新技能來適應這項轉變,整體社會結構與制度也需要適應這些變化,為人們提供新的機會與支援。
然而,AI Agent 的快速發展也伴隨著風險。像是 AI Agent 需要採用大量數據,如何確保資料不被濫用、是否安全與合規都是一大重點。此外,許多重複性工作可能因此消失,也會引發失業問題。在諸如醫療與金融等高風險情境下導入 AI Agent,如何在 AI 自主性與人類監督之間取得平衡也至關重要。
資料來源:IBM、Microsoft、World Economic Forum;本文初稿由 AI 協助整理,編輯:支琬清
延伸閱讀
用一個廣告毀了聖誕節!可口可樂、玩具反斗城的 AI 廣告為何引起大眾反彈?
「全員用 AI」沒那麼難!日月光如何讓一線品管員自行訓練專屬模型?
加入《經理人》LINE好友,每天學習商管新知
留言 0