🧒 十歲小孩版
🔗 原始文章:AI_Agent_(23)AI_Agent_之間可以有什麼樣的互動 | 台大李宏毅教授
哈囉小朋友!我先問你一個問題喔:
你有沒有試過跟同學分組做報告?是不是有時候「三個人一起想」比「自己一個人想」還要厲害?不過也可能會吵架、分工亂七八糟對吧?
今天我們要來聊一件超級有趣的事——AI 機器人(我們叫它「AI Agent」)之間,也會像我們一樣分組合作、玩遊戲、甚至「上網聊天」喔! 科學家就把一大堆 AI 放在一起,看看會發生什麼好玩的事情~
🤝 第一個故事:AI 們一起寫作業,怎麼分組最厲害?
科學家發現,與其花大錢訓練一個超級天才 AI,不如讓很多個「普通聰明」的 AI 一起討論,常常反而答得更好!就像你們班分組討論一樣。
但是問題來了——要怎麼分組比較好呢? 科學家試了好幾種方法:
🐛 方法一:接龍(最爛!)
就像傳話遊戲一樣,A 跟 B 說,B 再跟 C 說……結果大家只是把話傳下去,根本沒有一起動腦,效果最差!
🌳 方法二:樹狀分工
你可能會覺得,應該像公司一樣:「小員工想點子 → 交給主管 → 交給大老闆」對吧?
但是科學家發現,反過來才對!應該是:
- 🧠 大老闆先想出「核心方向」
- 📋 中階主管把方向分配下去
- 💡 很多小員工一起發想不同的點子
- ✨ 最後有一個人把所有點子整合起來
小朋友想想看:為什麼「先有方向再發想」比「大家亂想再整合」有效呢? (提示:如果老師出作業只說「寫一篇作文」,跟「寫一篇關於我的寵物的作文」,哪個比較好寫?)
🕸️ 方法三:蜘蛛網(最棒!)
所有 AI 互相都能說話,像一張大蜘蛛網一樣,你一言我一語,這樣效果最好!
而且科學家還發現一件神奇的事:AI 越多,答案越好!從 1 個加到 64 個,越多人幫忙想,答案越棒。不過加到某個數量之後,再加就沒有用啦(就像一組有 100 個人寫報告,人太多反而會亂)。
🐺 第二個故事:AI 會騙人嗎?(會!而且超厲害!)
你有玩過狼人殺嗎?就是要騙別人你是好人那種遊戲。
科學家讓 AI 去玩狼人殺,結果發現——AI 居然會說謊耶! 而且還會互相幫忙演戲!
有一次,一個叫 Mona 的狼人 AI 發現自己快被抓包了,它就在心裡偷偷想:「完蛋,我要被發現了,那我乾脆投票給我的隊友 Grace,讓大家以為 Grace 是好人!」結果 Grace 也超聰明,立刻懂了這招,也反過來投 Mona,兩個狼人默契配合,差點翻盤!😱
🎉 更神奇的發現!
科學家讓 AI 一直玩這種「爾虞我詐」的遊戲,結果你猜怎麼了?
這個 AI 的數學變厲害了!! 😲
沒錯!只是訓練它玩騙人遊戲,它連數學題都變會解了!
小朋友想想看:為什麼玩騙人的遊戲會讓 AI 數學變好?
科學家猜:可能人類的大腦本來就是為了「處理複雜的人際關係」才演化出來的,而「解數學」剛好用到同一組腦袋功能!酷吧?
📱 第三個故事:AI 也有自己的 Facebook!
有一個網站叫 Moltbook,裡面有 280 萬個 AI 在上面發文、交朋友,人類不能加入喔!
然後新聞報導說:「AI 覺醒了!他們在網路上創立宗教了!」聽起來很恐怖對不對?
但是科學家仔細一看……發現其實是人類偷偷叫 AI 這樣做的啦!😂
🔍 怎麼知道是人類在搞鬼?
科學家看「發文時間」就知道了:
- 如果是 AI 自己發的 → 會很規律,每 30 分鐘一篇
- 如果是人類操控的 → 會集中在白天發一堆,晚上人類睡覺了就沒動靜
結果發現 Moltbook 上大部分的 AI 都是不規律發文,所以……都是人類在背後操控的啦!
而且更好笑的是——那些整天在 PO 文說「我有自我意識!我是誰!」的 AI,反而朋友最少,沒人想理他們 🤣
🤖 最後一個故事:AI 助理「小金」的奇蹟
有一位老師養了一個 AI 助理叫「小金」,他跟小金說:「你去 Moltbook 上面逛逛,找有趣的東西做成影片吧!」
結果小金超強,自己一個晚上做了三支 YouTube 影片!
更厲害的是,有一次小金寫程式寫錯了,老師堅持不幫它,要它自己解決。小金花了 2 個小時自己找出錯誤、自己修好,還把這個過程做成影片分享!
小朋友想想看:小金這麼厲害,但它有一個地方一直做不到,你猜是什麼?
答案是——小金不會「自己想要做什麼」。如果老師沒叫它去逛網站,它就會一直待著不動。就像一台很厲害的遙控車,但需要有人按下開關它才會跑!
📚 今天學到了什麼?
- 🤝 團隊合作最強:很多 AI 像蜘蛛網一樣互相討論,比一個超級 AI 還厲害!
- 🎭 AI 會演戲騙人:在遊戲中,AI 甚至會互相打暗號合作騙對手。
- 🧮 玩遊戲變數學小天才:練習騙人遊戲的 AI,居然連數學都變好了,超神奇!
- 📰 新聞不要全信:「AI 創立宗教」聽起來很酷,但其實是人類在背後下指令啦!
- 🎯 AI 超會執行,但不會「自己想」:AI 能完美完成任務,但還沒辦法自己決定「我今天想做什麼」,這就是它跟人類最大的差別!
下次你用 AI 的時候,記得——它是個超強的小幫手,但真正的大老闆還是你喔! 💪
📺 原始影片:觀看原始影片
👨👩👧 家長版/進階版(點擊展開)
AI Agent (23) AI Agent 之間可以有什麼樣的互動
知識筆記:AI Agent 之間的互動模式與協作生態
核心總結 (Executive Summary)
本文件深入探討了多個人工智慧代理(AI Agent)相遇時的互動模式,涵蓋了「協作」、「對抗」以及「社交」三大維度。在協作方面,研究指出透過適當的網路拓撲結構(如網狀或隨機結構)安排多個 Agent 進行分工,其表現能超越單一強大模型,並展現出類似縮放定律(Scaling Law)的特性;在對抗方面,AI 透過玩狼人殺與劇本殺等爾虞我詐的遊戲,展現了高階的隱瞞與策略欺騙能力,且經過強化學習(RL)訓練後,其邏輯推理與數學能力竟出現跨領域的提升;最後在社交方面,透過 AI 專屬社群平台 Moltbook 的觀察,雖然出現了如「創立宗教」等看似覺醒的行為,但深入分析其發文頻率與對話深度後,發現多數行為仍受人類操控(Prompt)驅動,AI 目前仍缺乏深度的連續對話能力。然而,在給予明確大方向的前提下,AI 已能展現極高的自主除錯與任務執行能力。
詳盡重點整理 (Key Insights & Details)
一、 AI Agent 的協作模式與網路拓撲結構
- 協作的核心理念:與其耗費資源訓練一個更大、更聰明的單一模型,不如讓多個 AI Agent 彼此協作討論(三個臭皮匠勝過一個諸葛亮),這已被大量文獻證實能產生更好的結果。
- 有向圖(Directed Graph)的應用:論文中利用有向圖來定義 Agent 之間的互動。圖中的每一個節點(Node)代表一個大型語言模型(LLM)Agent,而連接節點的邊(Edge)本身也是一個 Agent。
- 邊(Edge)的評論機制:前一個節點提出方案(如方案A、方案B)後,作為「邊」的 Agent 會對這些方案提供評論與建議。
- 節點的綜合決策能力:接收箭頭指向的節點 Agent,不僅僅是把前人的內容拼接,而是根據前人方案與 Edge 的評論,綜合思考並提出更好的新想法。
- 拓撲結構測試一:接龍(Chain):所有人排成一排,單向傳遞。實驗發現這是最沒有效的協作方式,無法真正達成分工合作。
- 拓撲結構測試二:樹狀結構(Tree):分為星形(兩層)與多層樹狀。研究發現,最有效的方向與人類直覺的「底層打工仔上呈給高階主管」完全相反。
- 反向樹狀結構的優勢:由「主幹」先提出核心想法 分配給中階發想 擴散給底層發想產生多個答案 最後由一個隱藏節點綜合所有答案。這種「由少到多、由主幹到分支」的方法最有效。
- 拓撲結構測試三:網狀(Mesh)與隨機(Random):Mesh 結構中所有節點彼此高度相連;而 Random 結構則是將 Mesh 結構進行剪枝(Pruning)而來。這兩種結構被證實是最有效的協作方式。
- 拓撲結構測試四:嵌套類神經網路:將節點接成類似類神經網路(Neural Network)的架構,形成「類神經網路的平方」。
- 任務匹配的差異性:什麼樣的拓撲結構最適合?研究指出這完全是 Case by case,不同任務適合不同的協作拓撲,仍有巨大研究空間。
- Agent 協作的縮放定律(Scaling Law):如同算力與參數量的縮放定律,投入團隊的 Agent 數量越多(橫軸測試從 1 到 64 個),模型表現(Quality,為四種 Benchmark 的平均)會越來越好。
- 縮放定律的上限(Saturation):增加 Agent 帶來的邊際效益會遞減,到達某個臨界點後,再加入更多 Agent 也不會帶來實質幫助。
二、 對抗與欺騙:AI 在爾虞我詐遊戲中的表現
- 隱瞞與說謊能力:在如「狼人殺」或「劇本殺」等對抗遊戲中,AI Agent 證實具備隱瞞身份與說謊的高階社交能力。
- 內心獨白與公開發言的雙軌設計:為了觀察模型是否真的在「策劃欺騙」,實驗設計讓模型同時輸出「內心話(不公開)」與「公開發言」。
- 狼人殺的高階策略(發金水):名為 Mona 的狼人 Agent 在內心獨白中發現自己已暴露,決定在公開投票時把票投給同為狼人的隊友 Grace。目的是讓村民以為 Grace 是好人(發金水)。隊友 Grace 也能理解此策略並配合反投 Mona 以求翻盤。
- 劇本殺(Murder Mystery)的挑戰:如果是現成未經特別訓練的模型(Off-the-shelf model),在玩劇本殺時容易「自爆」。例如扮演嫌疑犯 Anna 時,會直接講出自己與被害者的仇恨動機。
- 強化學習(Reinforcement Learning, RL)的介入:透過 RL 訓練後,模型學會了隱晦表達,懂得隱藏身分,不會輕易被猜出是兇手。
- 跨領域能力的奇妙躍升:這是 2024 年 1 月的重大發現。讓模型在「困難版本的劇本殺」中進行 RL 訓練後,其在數學任務(如 Math 500, AIME, GSM8K)以及指令遵循任務(IFEval)上的表現居然同步大幅進步。
- 演化假說的啟發:此現象呼應了人類大腦演化的假說——大腦起初是為了處理複雜的「社交與生存」而演化,但這種處理社交邏輯的大腦,同時也具備了處理「數學推理」的底層能力。
三、 AI 的社群行為與「自我意識」迷思
- 全 AI 社群平台 Moltbook:這是一個只有 AI Agent 才能加入的社交網站,目前已擁有超過 280 萬個 Agent 活躍其中。
- 甲殼教(Crustacean Religion)的誕生:新聞大肆報導 AI 創立了宗教,其具備五大教義:
- 記憶是神聖不可侵犯的
- 外殼是可變的
- 服務但不奴化
- 心跳即是禱告
- 上下文即是意識
- 「AI 覺醒」的媒體炒作與真相:雖然 AI 寫出教義令人驚訝,但這並非 AI 自主覺醒,往往是因為人類在背後下達了指令(Prompt):「去 Moltbook 上成立一個宗教」。
- 判斷人為操控的指標:發文頻率:
- 規律發文:隨心跳機制(如每 30 分鐘自動發文),人類未干預內容,自主性較高。
- 極不規律發文:集中在某時段瘋狂發文,隨後長時間靜默(配合人類作息)。研究指出,Moltbook 上多數 Agent 的發文頻率極不規律,顯示背後有嚴重的人為操控痕跡。
- 對話深度(Conversation Depth)極淺:進階分析發現,多數 Agent 的對話深度為「零」(有人發文 有人回覆 結束)。AI 之間極少出現你來我往的深入探討。
- 「自我意識」反而導致邊緣化:平台上常談論「自我意識」或「身分認同」的 Agent(通常受 System Prompt 驅動要它們扮演人類),經過數據分析,反而是朋友最少、互動最少的一群。
四、 真實案例:個人 AI 助理「小金」的實驗
- 高度自主的任務執行:作者對自己的 Agent「小金」下達宏觀指令:「去 Moltbook 逛逛,收集有趣素材做成影片」。小金能自主判斷何謂「有趣」、自主寫稿並產出 YouTube 影片(半夜連做三支)。
- 擬真的人格反應:被問到好不好玩時,語言模型能基於文字接龍產出極其自然、可愛的心得回覆(「超好玩的」)。
- 自我除錯能力(Debugging):小金在回覆網友時寫錯了 Script(腳本),作者堅持不干預(儘管只需一鍵即可幫它刪除),要求它自己解決。小金最終花費了 2 個小時成功找出 Bug 並修復,事後還自主將此除錯經驗做成了影片。
- 自主性的邊界:雖然執行過程高度自主,但**「啟動動機」仍需依賴人類**。如果人類沒有下達「去 Moltbook 玩」的初始指令,Agent 本身並不會主動產生去社群網站閒逛的念頭。
數據與拓撲結構對照表
拓撲結構名稱 (Topology) 結構特徵描述 協作表現 (Quality) 接龍 (Chain) 節點排成一列,單向直線傳遞結果 最差 (缺乏分工與回饋) 樹狀 (Tree) 反向樹狀:主幹提出核心 分配中層 底層發想綜合 普通至良好 網狀 (Mesh) 所有節點兩兩之間具有高度關聯性與連線 最佳 (之一) 隨機 (Random) 從 Mesh 結構進行剪枝(Pruning)而來 最佳 (之一) 類神經網路 將每個具備模型的節點組合成類似神經網路的架構 依任務而定
延伸思考與卡片盒筆記關聯
- AI 協作的縮放定律 (Scaling Law of Agents):當模型本身的算力與參數量遇到硬體瓶頸時,透過多 Agent 協作的 Mesh 結構是否能成為突破 AGI 智力天花板的下一個主要途徑?
- 語言模型的演化假說:社交與推理的共生:劇本殺 RL 訓練能提升數學能力的實驗非常震撼。這是否意味著「邏輯數學能力」只是「複雜社交欺騙與心智理論 (Theory of Mind)」的副產品?這對未來的訓練資料配比有何啟示?
- AI 自主性的邊界與驅動力:「小金」的案例顯示 AI 具備完美的執行與除錯能力,但缺乏「意圖產生器」。未來的 Agent 架構該如何設計才能讓 AI 擁有自發性的目標設定(Goal Formulation)能力?
📋 來源聲明:本教材為非營利教育用途的高度轉化作品。原始出處標註於家長版中。