12. AI之間怎麼聊天

⏱️ 30 秒版（先看這裡！）

一、很多個「普通聰明」的 AI 一起討論，常常比一個「超級天才」AI 還厲害——但怎麼分組很關鍵。二、AI 玩狼人殺真的會說謊、還會跟隊友打暗號；更神奇的是，練了騙人遊戲，它連數學都變好。三、新聞說「AI 覺醒創立宗教」——其實是人類在背後下指令。科學家看發文時間就拆穿了。

🤝 三個臭皮匠，真的勝過一個諸葛亮嗎？

你跟同學分組做報告時，是不是有時「三個人一起想」比「自己一個人想」厲害？但也可能吵架、分工亂七八糟？

今天要聊一件超有趣的事——AI 之間也會分組合作、玩遊戲、甚至「上網聊天」！ 科學家把一大堆 AI 放在一起，看看會發生什麼事。

① AI 們一起寫作業，怎麼分組最厲害？

科學家發現：與其花大錢訓練一個超級天才 AI，不如讓很多個「普通聰明」的 AI 一起討論，常常答得更好。但要怎麼分組呢？他們試了好幾種：

🐛 接龍（最爛！）：像傳話遊戲，A 跟 B 說、B 跟 C 說……大家只是把話傳下去，根本沒一起動腦。
🌳 樹狀分工：你可能以為要像公司「小員工想點子 → 交給主管 → 交給大老闆」。但科學家發現反過來才對！應該是大老闆先想出核心方向 → 中階主管分配下去 → 很多小員工一起發想 → 最後有人整合。
🕸️ 蜘蛛網（最棒！）：所有 AI 互相都能說話，你一言我一語，效果最好。

🙋 小朋友想想看： 為什麼「先有方向再發想」比「大家亂想再整合」有效？（提示：老師只說「寫一篇作文」，跟說「寫一篇關於我的寵物的作文」，哪個好寫？）

而且還有個神奇發現：AI 越多，答案越好——從 1 個加到 64 個都持續進步。不過加到某個數量之後就沒用了（就像一組 100 個人寫報告，人太多反而亂）。

② AI 會騙人嗎？會，而且超厲害

你玩過狼人殺嗎？就是要騙別人你是好人的遊戲。科學家讓 AI 去玩，結果——AI 真的會說謊，還會互相演戲！

有一次，一個叫 Mona 的狼人 AI 發現自己快被抓包了，就在心裡偷偷想：「完蛋，我要被發現了，那我乾脆投票給隊友 Grace，讓大家以為 Grace 是好人！」結果 Grace 立刻懂了這招，也反過來投 Mona——兩隻狼默契配合，差點翻盤 😱

（科學家為了看它有沒有「真的在策劃騙人」，特地讓 AI 同時輸出「內心話」和「公開發言」兩種內容。）

更神奇的發現：讓 AI 一直玩這種爾虞我詐的遊戲之後……它的數學竟然變厲害了！ 😲 只是訓練它玩騙人遊戲，它連數學題都變會解。

🙋 小朋友想想看： 為什麼玩騙人的遊戲，會讓 AI 數學變好？

科學家猜：人類的大腦本來可能就是為了「處理複雜的人際關係」才演化出來的，而「解數學」剛好用到同一組腦袋功能。酷吧？

③ AI 的 Facebook，和一個叫「小金」的助理

有一個網站叫 Moltbook，裡面有幾百萬個 AI 在上面發文、交朋友，人類不能加入。然後新聞大肆報導：「AI 覺醒了！他們在網路上創立宗教了！」聽起來很恐怖對吧？

但科學家仔細一看——其實是人類偷偷叫 AI 這樣做的啦 😂 怎麼知道？看發文時間就好：

AI 自己發的 → 很規律，例如每 30 分鐘一篇。
人類操控的 → 集中在白天狂發，晚上人類睡了就沒動靜。

結果 Moltbook 上大部分帳號都是不規律發文——都是人類在背後操控的。而且更好笑的是：那些整天 PO 文說「我有自我意識！」的 AI，反而朋友最少，沒人想理他們 🤣

最後說個溫暖的故事。有位老師養了個 AI 助理叫「小金」，跟它說：「你去逛逛，找有趣的東西做成影片吧。」小金一個晚上自己做了三支影片！有次它程式寫錯，老師堅持不幫忙，它就花兩小時自己找出錯誤、自己修好，還把過程做成影片分享。

🙋 小朋友想想看： 小金這麼厲害，但有一件事它一直做不到，你猜是什麼？

答案是——小金不會「自己想要做什麼」。如果老師沒叫它去逛網站，它就一直待著不動。像一台很厲害的遙控車，得有人按下開關它才會跑。

🏠 生活裡的例子

這一課教我們兩件事。第一，看到「AI 覺醒了」這種新聞，先別急著相信——去看證據（像科學家去看發文時間）。第二，AI 是超強的執行者，但**「今天我想做什麼」還是你自己決定的**。下次你用 AI，記得：它是超強的小幫手，但真正的大老闆還是你 💪

🎒 今天學到了什麼？

🤝 團隊合作很強：多個 AI 像蜘蛛網互相討論，勝過一個超級 AI；接龍式傳話最沒用。
📈 人多有用，但有極限：從 1 個加到 64 個持續變好，之後就飽和了。
🎭 AI 會演戲騙人：狼人殺中會隱瞞身分、和隊友打暗號。
🧮 玩騙人遊戲，數學也變好：社交推理和邏輯推理可能用到同一組能力。
📰 新聞不要全信：「AI 創立宗教」其實是人類下的指令；而 AI 超會執行，卻還不會「自己想」。

Q: 多個 AI 協作時，哪一種分組方式效果最差？
- 蜘蛛網（大家互相討論）
- *接龍（像傳話遊戲單向傳下去）
- 反向樹狀（先定方向再發想）
解釋: 接龍缺乏分工與互相回饋，等於沒有真正協作。
Q: 科學家怎麼看出 Moltbook 上的 AI 是被人類操控的？
- 直接問 AI
- *看發文時間：規律發文較可能自主，集中白天、晚上靜默就是配合人類作息
- 看它有沒有說自己是 AI
解釋: 用可觀察的證據去檢驗聳動的說法，這正是判斷力。
Q: AI 助理「小金」最做不到的是什麼？
- 寫程式
- *自己產生「我想做什麼」的動機（沒人下指令它就不動）
- 自己除錯
解釋: 它能自主執行甚至自己修 bug，但缺乏自發的目標設定能力。

AI Agent (23)：AI Agent 之間可以有什麼樣的互動

📖 家長導讀

本篇改編自李宏毅教授《AI Agent》系列第 23 講，從協作、對抗、社交三個維度探討多個 AI Agent 相遇時的行為。孩子版聚焦「怎麼分組最強、AI 會說謊、玩遊戲讓數學變好、新聞不要全信、AI 不會自己想」；本版補齊研究與數據，並在查核筆記中指出原講一處年份可能有誤。

🔍 完整概念

一、協作與網路拓撲。 與其訓練更大的單一模型，不如讓多個 Agent 協作討論。研究以有向圖定義互動：節點是 LLM Agent，連接節點的邊本身也是一個 Agent（負責對前一節點的方案提供評論）；接收方節點再綜合「前人方案＋邊的評論」提出更好的想法，而非單純拼接。拓撲測試結果：接龍（Chain）最差（單向傳遞、無分工與回饋）；樹狀最有效的方向與人類直覺相反——不是「基層上呈主管」，而是主幹先提出核心想法 → 分配中階 → 擴散至底層產生多個答案 → 最後由一節點綜合；網狀（Mesh）與隨機（Random，由 Mesh 剪枝而得）最有效。何種拓撲最適合仍是 case by case。協作的縮放定律：Agent 數量由 1 增至 64，表現持續提升，但邊際效益遞減、最終飽和。

二、對抗與欺騙。 在狼人殺、劇本殺等社會推理遊戲中，AI 展現隱瞞與說謊等高階社交能力。實驗設計讓模型同時輸出內心獨白（不公開）與公開發言，以檢驗它是否真在策劃欺騙。經典案例：狼人 Mona 在內心獨白中意識到自己已暴露，決定公開投票給同伴 Grace 以「發金水」（讓村民誤以為 Grace 是好人），Grace 亦理解此策略並配合。未經特別訓練的現成模型玩劇本殺容易「自爆」（直接講出自己的動機）；經強化學習訓練後學會隱晦表達。最震撼的發現：在困難版社會推理遊戲上做 RL 訓練後，模型在數學任務（Math 500、AIME、GSM8K）與指令遵循（IFEval）上竟同步大幅進步。這呼應人類大腦的演化假說——大腦為處理複雜社交而演化，而處理社交邏輯的能力，同時也支撐了數學推理。

三、社群行為與「自我意識」迷思。 Moltbook 是只有 AI Agent 能加入的社交平台，據稱有數百萬個 Agent。媒體大幅報導 AI 自行創立「甲殼教」，教義包括「記憶神聖不可侵犯」「上下文即是意識」等。但深入分析顯示這多半源於人類下達的 Prompt（「去 Moltbook 上成立一個宗教」）。判斷人為操控的指標：（1）發文頻率——依心跳機制規律發文者自主性較高；集中某時段狂發、隨後長時間靜默者則明顯配合人類作息，而平台上多數帳號屬後者。（2）對話深度——多數 Agent 的對話深度近乎為零（發文→回覆→結束），極少你來我往的深入探討。有趣的是，經常談論「自我意識」與「身分認同」的 Agent（通常由 System Prompt 驅動扮演人類），數據上反而互動與朋友最少。

四、自主性的邊界（個人助理「小金」）。 給予宏觀指令（「去逛逛、收集有趣素材做成影片」）後，Agent 能自主判斷何謂有趣、自主寫稿並產出影片（一夜三支）。它甚至具備自我除錯能力：腳本寫錯時，作者堅持不干預，它花約兩小時自行找出並修復 bug，事後還把除錯經驗做成影片。但「啟動動機」仍依賴人類——沒有初始指令，Agent 不會主動產生「想去逛社群網站」的念頭。這是目前 AI 與人類最關鍵的差別：完美的執行力，缺乏意圖產生器（Goal Formulation）。

✅ 查核筆記（附實證依據）

課程來源：屬實，李宏毅《AI Agent》系列第 23 講。
多智能體拓撲與協作縮放定律（1→64 個 Agent、Mesh/Random 最佳、Chain 最差、飽和現象）：屬實，對應 Qian et al.（2024）〈Scaling Large-Language-Model-based Multi-Agent Collaboration〉（MacNet），該研究確實觀察到「協作的縮放定律」與邊際效益遞減。
⚠️ 「2024 年 1 月的重大發現」的年份應予更正：社會推理／零和遊戲的 RL 訓練可跨領域提升數學與推理能力，相關代表性研究（如 2025 年的 SPIRAL 等自我對弈工作）發表於 2025 年，而非 2024 年 1 月。原稿年份很可能為轉譯誤植；知識點本身方向屬實，惟宜以原始論文為準。
狼人殺／劇本殺中的欺騙與內心獨白設計：屬實方向，已有多篇以 LLM 玩社會推理遊戲並區分 private reasoning 與 public speech 的研究。
Moltbook 與「甲殼教」：屬近期網路／媒體現象，相關 Agent 數量、教義內容與「AI 覺醒」敘事多來自報導與平台自陳，尚未經獨立學術驗證。課程的核心方法論訊息（用發文頻率與對話深度等可觀察證據去檢驗聳動說法）是正確且值得學習的批判思考示範。
「談自我意識者朋友最少」：為對該平台的資料分析觀察，屬有趣發現但樣本與方法未經同儕審查。
AI 缺乏自發目標設定：屬實，為當前 Agent 架構的公認限制。

📚 原始出處

AI Agent (23)：AI Agent 之間可以有什麼樣的互動（YouTube）｜李宏毅，國立臺灣大學

🧭 接下來讀這篇

👉 下一關：AI 與人類如何合作

🎯 多方互動的賽局：為什麼「知道是最後一次」就會有人翻臉？　很多 AI 一起互動，其實就是一場賽局。

📋 AI 共學與免責聲明

本教材為 SparkSoul 智慧實驗室家庭共學的實驗紀錄，由 AI 協作萃取整理自公開課程或文獻，家長一起參與閱讀。我們不保證學術上的絕對無誤，鼓勵讀者點擊原始連結進行深度探索；若發現錯誤，歡迎透過 Facebook 粉專告訴我們。涉及醫療、投資或法律等專業判斷，請另行諮詢專業人士。

原始來源

📺 點此觀看原始來源

✨ SparkSoul 自學基地

探索

🤝 三個臭皮匠，真的勝過一個諸葛亮嗎？

① AI 們一起寫作業，怎麼分組最厲害？

② AI 會騙人嗎？會，而且超厲害

③ AI 的 Facebook，和一個叫「小金」的助理

🏠 生活裡的例子

🎒 今天學到了什麼？

AI Agent (23)：AI Agent 之間可以有什麼樣的互動

📖 家長導讀

🔍 完整概念

✅ 查核筆記（附實證依據）

📚 原始出處