AI Agents 演進史:為什麼你的 AI 助理還不夠聰明?從 1.0 到 3.0 的真實進化論
過去兩年,AI Agent(人工智慧代理)這個詞變得非常熱門。但很多人——甚至包括很多付費買了 AI 工具的用戶——都很困惑:「為什麼我的 AI 除了陪聊和寫 Email,還是沒辦法幫我真正『處理』一件複雜的事?」
這篇文章我不談艱澀的程式架構,我想用一個最直觀的例子:「幫我規劃並預訂一趟五天四夜的京都家庭旅遊」,帶你看懂 AI Agent 到底經歷了什麼,以及為什麼我們期待的「全能管家」還在路上。
任務設定
假設我們給 AI 下達同一個指令:
「幫我規劃下個月去京都的五天四夜行程。兩大兩小,預算 10 萬台幣,要住在交通方便的地方,重點是:孩子對海鮮過敏,所有餐廳都要避開海鮮。」
讓我們看看不同世代的 Agent 會怎麼處理這件事。
Agents 1.0:熱血但混亂的實習生(2023 年 AutoGPT 時期)
這是 AI Agent 剛誕生的階段,就像剛畢業的大學生,充滿幹勁但沒有工作方法。
- 它的做法:它接到任務後,會瘋狂地在 Google 搜尋「京都 飯店」、「京都 天氣」。
- 實際結果:
- 它可能陷入死循環:一直重複搜尋「京都最佳拉麵」,然後把自己卡死。
- 它會產生一大堆沒用的文字檔,告訴你它「正在思考」。
- 結局:通常在執行 10 分鐘後報錯崩潰。或者它給你列了一家餐廳,結果你一查,那家店倒閉兩年了。
問題在哪? 它的腦容量(Context)很小,記不住「孩子對海鮮過敏」這個條件,做著做著就忘記初衷,只顧著找「最便宜的飯店」。
Agents 1.5:聰明但「只動口不動手」的顧問(現在:ChatGPT 5.1, Claude 4.5)
這也是我們目前大多數人正在使用的階段。模型變聰明了,邏輯更強了。
- 它的做法:它能完美理解你的需求。它會寫出一份看起來無懈可擊的行程表,甚至幫你做成精美的表格。
- 實際結果:
- Day 1:參觀清水寺,午餐推薦「京豆庵」。
- Day 2:前往嵐山...
- 看起來很完美,但... 當你真的要去訂房時,發現它推薦的飯店那天客滿了。你去查餐廳,發現「京豆庵」那天公休。而且,它只是給你連結,你還是得自己打開網頁、輸入信用卡、一個一個預訂。
問題在哪? 它是一個完美的「規劃師」,但不是「執行者」。它是在根據網路上的舊資料「寫作文」,而不是連上即時系統去幫你「辦事」。
Agents 2.0:會思考、會修正的專案經理(2025 年正在發生的變革)
這是目前技術正在突破的前緣(Deep Agents)。它不再只是「接話」,而是懂得「規劃與檢查」。
- 它的做法:
- 拆解任務:它會自己生出一個 To-Do List:「1. 查機票剩餘位子 2. 確認飯店空房 3. 篩選非海鮮餐廳」。
- 分工合作:它會呼叫一個負責搜尋的「子代理」去查飯店,如果發現 A 飯店滿了,它不會直接瞎掰,而是會觸發 Plan B,去找 B 飯店。
- 嚴格審查:在推薦餐廳前,它會特別檢查菜單(甚至打電話給餐廳 AI)確認是否真的無海鮮。
- 實際結果:
- 它可能會跑個 5 分鐘,然後給你一個 「已經確認有房、有位、且符合過敏需求」 的最終方案。
- 你只需要點一個按鈕:「確認預訂」。
關鍵進化:它懂得知錯能改(Self-Correction)。如果發現路不通,它會回頭找新路,而不是死在半路上。
Agents 3.0:懂你情緒的貼身夥伴(未來的具身化代理)
這是我認為 AI 真正該有的樣子。它不只活在對話框裡,而是能「看見」你,「感知」環境。
- 場景:你在出發前一晚,加班到深夜,一臉疲憊地看著螢幕上的行程表。
- 它的做法:
- 觀察:透過電腦鏡頭或手機,它看到你的疲態(視覺感知)。
- 同理:它判斷原本「早上 6 點起床趕飛機」的行程會讓你崩潰。
- 主動建議:它主動開口說:「Ian,我看你今天很累。要不要我幫你把明早的機場接送延後半小時?另外,我幫你在飛機上預選了比較安靜的座位,你可以補個眠。」
關鍵進化:它不再是被動等待指令的工具,而是擁有 「五感」與「同理心」 的主動夥伴。
為什麼我們不需要一個「全知全能的神」?
看完上面的演進,很多人會問:「那我們最後會做出一個像《鋼鐵人》賈維斯那樣,什麼都懂、什麼都能做的超級 AI 嗎?」
我的答案是:不會,而且也不需要。
- 太貴了(熱力學限制):要讓一個 AI 同時懂天文地理,又要懂你家小孩對海鮮過敏,還要隨時待命,這需要的運算能源大到無法想像。殺雞不需要用牛刀,訂餐廳不需要動用全人類的知識庫。
- 隱私問題:如果你希望 Agent 3.0 能讀懂你的臉色,這些數據必須在你的手機或電腦(Edge 端)即時處理,而不是傳回雲端給大公司看。
未來的終局是分工合作:
- 雲端的大模型負責複雜的知識(像大學教授)。
- 你手機裡的個人 AI 負責懂你、照顧你的生活(像貼身管家)。
從 1.0 的瞎忙,到 2.0 的精準執行,再到 3.0 的同理陪伴。我們不需要一個高高在上的神,我們需要的是一群懂事、好用、且真正了解你的數位夥伴。
- ← Previous
AI Agents 的演進:從 1.0 到 3.0,以及為什麼我認為不會有全能 AGI - Next →
氣功該怎麼挑樹?