2. 幫AI找回記憶力

⏱️ 30 秒版（先看這裡！）

一、AI 聊久了會「忘記」——科學家用**「上下文工程」幫它整理要讀的東西，就像幫它整理書包。二、AI 的書包塞太多會讀到頭昏**（開頭結尾記得、中間迷路），所以要挑重點、做摘要、找同伴分工。三、跟 AI 說「你以前做對過」比說「你做錯過」還有效——因為提醒它錯的，它反而更容易再錯！

🤖 你有沒有跟 AI 聊天聊到它「忘記」你說過什麼？

想像你跟同學用 LINE 聊了整整三小時，你問他：「欸，我一開始說我喜歡吃什麼？」結果他說：「呃……我忘了耶！」

其實現在超紅的 ChatGPT、Gemini 也會有一樣的困擾！今天就來看科學家怎麼幫 AI 管理它的「大腦記憶」，讓它更聰明。這個技術叫做 「上下文工程」（Context Engineering），聽起來很難，其實就像在幫 AI 整理書包！

🎩 以前的人怎麼跟 AI 講話？用「神奇咒語」！

以前的 AI 比較笨，要讓它好好做事，人類得對它唸「神奇咒語」，很像哈利波特：

跟 AI 說「請深呼吸再回答」，它真的會答得比較好！
跟它說「我會給你小費喔！」，它也會更認真！
最狠的是「你答對世界就會和平！」——ChatGPT 居然最吃這一套！

但有研究者跟 AI 說「你媽媽會以你為榮」，AI 完全不理——因為它根本沒有媽媽啊！ 😂

🤔 小朋友想想看： 為什麼對 AI 說「給你小費」它會更認真？它又拿不到錢！（提示：因為它是從網路上一大堆人類文字學來的，而人類看到「小費」通常會更認真。）

等 AI 越來越聰明，這些咒語就沒用了。於是科學家改研究「怎麼幫 AI 整理它要讀的東西」——這就是上下文工程的由來。

① AI 的書包裡裝了什麼？

你上學的書包有課本、鉛筆盒、聯絡簿；AI 回答問題時，它的「書包」裡也裝了六樣東西：

你問的問題（使用者提示）——你說「要用載具嗎？」它猜是交通工具；你說「我在超商結帳」，它就懂是電子發票載具了。
老闆給的規矩（系統提示）——像 Claude 的老闆偷偷寫了兩千多字規則：「不可以教人做核彈」「被罵時別馬上認錯」。
聊天的記憶——短期記得剛剛講什麼，長期會偷偷記住「這個人在修李宏毅老師的課」。
上網查資料（RAG）——但有時出大包：Google 的 AI 曾認真建議「披薩起司不黏？加點無毒膠水就好」，因為它抄了一則搞笑貼文！
使用工具——AI 現在能自己操作電腦，幫你上高鐵訂票、建資料夾，甚至把老師的簡報關掉（真的發生過）。
腦內小劇場（深度思考）——回答前先偷偷想：「方法 A 好像不對，那試試 B。」

② AI 也會「讀到頭昏眼花」！

你讀一本超厚的書，讀到中間會不會開始恍神？AI 也會！ 科學家發現三個奇妙現象：

🌀 中間迷路症：把答案藏在長文章的中間，AI 答對率超低——它只記得開頭和結尾，比亂猜還慘！
🍎 複製都會累：叫 AI「把『蘋果』複製一萬次」，複製到一半就開始出錯，像你罰寫抄到最後會抄錯字。
🦷 擠牙膏越擠越爛：一次把事情講清楚，AI 做得好；一句一句慢慢擠，它反而越做越差。

🤔 小朋友想想看： 這是不是跟寫功課很像？媽媽一下叫你寫國語、又叫你寫數學、又叫你整理書包，是不是比一次講完還煩？

③ 解決方法：三大絕招！

科學家想出三招幫 AI 整理書包：

✨ 第一招：挑重點（選擇） — 就像考試前只讀重點，AI 也先挑「現在最需要的」放進書包。有個叫「史丹佛小鎮」的研究，裡面的 AI 角色用三個標準挑記憶：多近期（昨天比去年重要）、多重要（被告白是 9 分重要）、多相關（跟現在的事有沒有關係）。而且——跟 AI 說「你以前做對過」它會更強；說「你做錯過」它反而錯更多，就像你越叫人「不要想白熊」，他腦中越是白熊！🐻‍❄️

🗜️ 第二招：壓縮（做摘要） — 你去玩一整天迪士尼，回來不會每一秒都講給阿嬤聽，你會說「我玩了雲霄飛車超好玩」。AI 也一樣，操作電腦時不記「滑鼠移到第 604 格點一下」，只記「餐廳訂位成功，9/19 下午 6 點」。

👥 第三招：分工合作（多個 AI） — 像分組報告，一人查資料、一人做簡報。要規劃旅行，就派小 AI 甲訂餐廳、小 AI 乙訂旅館，總召 AI 只要知道「都訂好了」，書包就不會被塞爆。

🤔 小朋友想想看： 寫「介紹台灣所有夜市」的報告，你要自己查 100 個，還是找 10 個同學每人查 10 個再合起來？

🏠 生活裡的例子

下次用 ChatGPT，你可以試試：把要它做的事「一次講清楚」，而不是擠牙膏一句一句加；需要它記住重點時，幫它「挑出關鍵」再貼給它。你會發現——會整理書包的人，才是真正的 AI 高手，這比會唸咒語重要多了。

🎒 今天學到了什麼？

AI 不是真的懂你，它在「文字接龍」——所以要它變厲害，就要整理好給它看的東西。
從「唸神奇咒語」進化到「整理書包」，就是從 Prompt Engineering 到 Context Engineering。
AI 書包塞太多會中間迷路、複製會累——能輸入不等於讀得懂。
三大絕招：挑重點（選擇）、做摘要（壓縮）、找同伴（多代理人協作）。
跟 AI 說「你做對過」比「你做錯過」有效——提醒它錯的，反而像白熊效應更容易再錯。

Q: 「上下文工程（Context Engineering）」在做的事，最像下面哪一個？
- 幫 AI 換一顆更大的腦袋
- *幫 AI 整理它要讀的東西，像整理書包
- 教 AI 唸咒語
解釋: 不改變模型本身，而是管理「放進去給 AI 看的資訊」，把需要的放進、不需要的清出。
Q: 「中間迷路症（Lost in the Middle）」是指？
- AI 走路會迷路
- *答案藏在長文章中間時，AI 答對率特別低（只記得開頭和結尾）
- AI 中午會想睡覺
解釋: 這是長文本的效能衰退現象，能「輸入」不代表能「讀懂」。
Q: 下列哪一招「不是」整理 AI 書包的三大絕招？
- 挑重點（選擇）
- 做摘要（壓縮）
- *把書包容量調到無限大
解釋: 就算容量很大也會「中間迷路、複製會累」，所以要靠選擇、壓縮、多代理人協作。

【生成式人工智慧與機器學習導論 2025】第 2 講：上下文工程（Context Engineering）

📖 家長導讀

本講改編自台大李宏毅教授《生成式人工智慧與機器學習導論 2025》第二講。核心論點：語言模型的本質是「文字接龍」，要改變它的表現只有兩條路——改變模型參數（訓練）或改變輸入（上下文工程）。上下文工程從早期手動輸入「神奇咒語」的 Prompt Engineering，演進為「自動化管理模型輸入」的系統性方法，是 AI Agent 能長時間自主完成任務的關鍵。孩子版用「整理書包」的比喻涵蓋六大上下文組成、三種效能衰退現象與三大管理策略；本版補齊機制、案例與數據。

🔍 完整概念

一、從 Prompt Engineering 到 Context Engineering。 在不重新訓練模型 $f$ 的前提下，優化輸出只能改變輸入 $x$ 。早期模型較弱，依賴特定格式與「神奇咒語」喚醒能力（給小費、「深呼吸」、承諾「世界和平」等情緒訴求）。但隨模型變強，咒語的邊際效益遞減——例如某數學任務 2023 年靠咒語可從 72% 提升到 88%，2024 年基礎準確率已達 85%、加咒語僅到 89%。於是焦點從「手寫完美咒語」轉向「自動化管理輸入上下文」，這是新名詞、但真正重要的是關注點的轉移。

二、完整上下文的六大組成。（1）使用者提示：含指令、前提與範例；「In-Context Learning」威力驚人——Gemini 1.5 讀完僅千人使用的卡拉蒙語（Kalamang）教科書例句後，翻譯評分可從近 0 分躍升到 4–5.5 分（滿分 6），全程不改權重。（2）系統提示：開發商的底層規則（Claude 的系統提示逾兩千字，含身份、日期、安全禁令、「被糾正時不要馬上認錯」等）。（3）記憶：短期（單一對話內）與長期（跨對話的個人化檔案）。（4）外部資訊（RAG）：補最新知識，但仍可能幻覺（Google AI Overview 引用 Reddit 玩笑，建議披薩加無毒膠水）。（5）工具使用：模型只能「輸出文字指令」，由外部程式執行後把結果放回上下文（Agent Mode 訂高鐵票、Gemini CLI 在終端機建檔案）。（6）深度思考：推理模型在上下文中自行演練「腦內小劇場」，通常對使用者隱藏。

三、Agent 時代的上下文挑戰。 Agent 把「一問一答」升級為「觀察→行動」的長循環，上下文持續膨脹。硬體上下文窗口雖從 GPT-4 的數萬 tokens 一路到 Gemini 1.5 的百萬級、Llama 4 號稱千萬級，但能輸入 ≠ 能讀懂：迷失在中間（Lost in the Middle）——答案置於長文中段時準確率暴跌，甚至低於不給文章的盲猜；上下文腐爛（Context Rot）——連「複製一萬次」這種簡單任務，正確率也隨長度直線下滑；擠牙膏效應——把需求拆成多輪冗長互動，反比一次講清楚更差且不穩定。

四、三大管理策略。（1）選擇（Selection）：進階 RAG 先把提示轉關鍵字、再對結果重排序（Reranking），甚至用小模型只挑「相關句子」；工具說明也應「按需取用」（less is more）；記憶選擇如史丹佛小鎮（Generative Agents）以近期性、重要性、關聯性三維度評分提取；經驗選擇則發現「給過去答對的正面經驗」有效，「給答錯的負面經驗」反而有害（白熊效應）。（2）壓縮（Compression）：遞迴式摘要——每隔一定互動或上下文達 90% 時，呼叫摘要模型壓縮舊紀錄；過濾 GUI 瑣碎操作，只留「A 餐廳訂位成功」這類結論；可另存完整日誌於檔案，並在摘要留一句「詳情見某檔案」以備調閱。（3）多代理人（Multi-Agent）：其價值不只「術業有專攻」，更是上下文隔離——總召 Agent 的上下文保持乾淨（只記「已訂妥」），子 Agent 各自承擔雜亂細節；處理上千篇論文的綜述時，讓數百個平行 Agent 各讀一篇再彙整，可避開 Context Rot。

✅ 查核筆記（附實證依據）

課程來源：屬實，台大李宏毅《生成式人工智慧與機器學習導論 2025》第二講。
迷失在中間（Lost in the Middle）：屬實，Liu et al.（2023, TACL）證實答案位於長上下文中段時檢索準確率顯著下降，呈 U 型（首尾效應）。
史丹佛小鎮（Generative Agents）：屬實，Park et al.（2023）以 recency／importance／relevance 三分數做記憶檢索。
Gemini 1.5 卡拉蒙語翻譯：屬實，對應 MTOB（Machine Translation from One Book）基準，長上下文讀入語法書後低資源翻譯大幅提升。
Google AI Overview 膠水披薩：屬實，2024 年 5 月真實事件，源於引用 Reddit 玩笑貼文。
上下文窗口數據：方向屬實但快速演變——Gemini 1.5 為 1M（後擴至 2M）、Llama 4 Scout 官方宣稱 10M；「號稱」用詞恰當，實際可用有效長度常低於名目值（正呼應 Context Rot）。

📚 原始出處

【生成式人工智慧與機器學習導論 2025】第 2 講（YouTube）｜李宏毅，國立臺灣大學

🧭 接下來讀這篇

👉 下一關：打開 AI 的腦袋

🔗 同主題：幫健忘的 AI 做筆記　讓 AI 記住事情的另一招。

📋 AI 共學與免責聲明

本教材為 SparkSoul 智慧實驗室家庭共學的實驗紀錄，由 AI 協作萃取整理自公開課程或文獻，家長一起參與閱讀。我們不保證學術上的絕對無誤，鼓勵讀者點擊原始連結進行深度探索；若發現錯誤，歡迎透過 Facebook 粉專告訴我們。涉及醫療、投資或法律等專業判斷，請另行諮詢專業人士。

原始來源

📺 點此觀看原始來源

✨ SparkSoul 自學基地

探索

🤖 你有沒有跟 AI 聊天聊到它「忘記」你說過什麼？

🎩 以前的人怎麼跟 AI 講話？用「神奇咒語」！

① AI 的書包裡裝了什麼？

② AI 也會「讀到頭昏眼花」！

③ 解決方法：三大絕招！

🏠 生活裡的例子

🎒 今天學到了什麼？

【生成式人工智慧與機器學習導論 2025】第 2 講：上下文工程（Context Engineering）

📖 家長導讀

🔍 完整概念

✅ 查核筆記（附實證依據）

📚 原始出處