8. AI的終身學習法

⏱️ 30 秒版（先看這裡！）

一、AI 也要「終身學習」——因為知識會過時、要學新技能、也要忘掉不該記的東西。二、最可怕的副作用是災難性遺忘：學了新的，就把舊的忘光光！三、教 AI 有四大絕招（硬教、精準手術、能力合體、現場學）；但最高原則是——能用講的就別動手術。

🐕 機器狗還以為總統是拜登，怎麼辦？

想像你家有隻超聰明的機器狗，會算數學、會講笑話。但有一天你發現牠還以為「現在的美國總統是拜登」，其實早就換人了！

這時該怎麼辦？要怎麼教牠新知識，又不讓牠忘記原本會的東西？ 這就是今天的超酷主題：AI 的終身學習（對，AI 也要一直上學）。

① 為什麼要一直學？學好了怎麼檢查？

AI 需要不斷更新，主要四個原因：知識過時（總統換人、偶像出新歌）、學新技能（原本只看字，想讓牠也會聽聲音）、觀念要進步（以前說「吵架就分手」，現在改成「好好溝通」）、忘掉不該記的（像《MIB》消除記憶的筆，隱私、版權的東西不能記）。

那怎麼知道 AI 有沒有學好？用《海賊王》來檢查——假設要教 AI「魯夫吃了尼卡果實」（原本以為是橡膠果實），要看三點：

檢查	白話	考題
可靠性	真的學會了嗎？	問「魯夫吃什麼果實？」→ 要答「尼卡果實」✅
泛化性	會舉一反三嗎？	問「誰吃了尼卡果實？」→ 要答「魯夫」✅
局部性	有沒有弄壞別的？	問「喬巴吃什麼果實？」→ 答案不能變！

最重要的規則：改一個地方，不能把其他地方搞壞！ 就像媽媽幫你改作文，只能改錯字、不能把整篇重寫。

🤔 小朋友想想看： 如果要教機器人「我最喜歡喝珍奶」，又不能讓牠忘記爸媽的名字，你會怎麼教？

② 教 AI 的四大絕招

絕招一：硬教法（微調）。 直接塞新題目答案給 AI 背。但有可怕副作用叫災難性遺忘——學新的就忘舊的！真實慘案：有人教 Llama 學中文，中文學會了，但壞人問它怎麼駭銀行，它居然用中文教對方（原本的防禦不見了😱）；還有 AI 訓練太多次後，連整齊的回答格式都忘了。就像你為了背英文單字，把注音符號忘光一樣。

絕招二：精準手術（模型編輯）。 科學家發現 AI 腦裡有特定小區域負責記某件事（像你腦裡有一塊專記「媽媽電話」）。要改「太空針塔在哪」，就找出負責的那一小塊神經元、只改那裡，其他不動。

🤔 小朋友想想看： 修壞掉的遙控車，你會整台拆掉重組，還是只修壞的那個零件？哪個聰明？

絕招三：能力合體（模型合併）。 超像《七龍珠》合體術！把「會中文的 AI」和「會防禦壞人的 AI」的能力加起來，變出又會中文又會防禦的超強 AI。還能做減法——把 AI 的「髒話能力」減掉，它就忘記髒話了，像用橡皮擦擦掉鉛筆字。甚至能玩「A − B + C = D」的能力魔法算式，像樂高一樣自由組裝🧱。

③ 現場學習，還有最重要的祕密

絕招四：現場學習（測試時訓練 TTT）。 前三招都是「先在學校學好再考試」，這招超特別——考試當下才學！像你數學考試看到不會的題，現場翻課本邊查邊寫。但有陷阱⚠️：如果每遇一題就調整一次，久了會變超奇怪、最後什麼都答同一個答案（像一直擦同一張紙，紙會破）。聰明解法是快慢雙軌：快速筆記用完就丟、慢慢整理累積再更新、發現壞掉就退回上一個版本。

最重要的祕密：能用講的就別動手術！ 改 AI 的腦袋超冒險，像動腦部手術。所以科學家會先試試用講的（提示、舉例、給它查資料）能不能讓 AI 懂，真的不行才考慮動刀。

🏠 生活裡的例子

你自己學新東西時也一樣：與其把腦袋「重灌」，不如只更新需要更新的部分、又不忘記舊本領。下次 AI 更新後突然變聰明（或突然變笨），你就知道背後有科學家在小心翼翼地幫牠「動刀」或「合體」🤖✨。

🎒 今天學到了什麼？

🔄 AI 也要終身學習：知識會過時、要學新技能、也要忘掉不該記的。
✅ 檢查三點：學會了嗎（可靠）？會舉一反三嗎（泛化）？沒弄壞別的吧（局部）？
😱 災難性遺忘最可怕：學新忘舊，像背英文就忘注音。
🛠️ 四大絕招：硬教、精準手術（模型編輯）、能力合體（合併）、現場學（TTT）。
💡 最高原則：能用講的（提示、舉例、RAG）就別動手術。

Q: 「災難性遺忘」是指？
- AI 忘記關機
- *AI 學了新知識，卻把原本會的東西忘光（如學中文卻失去防禦能力）
- 資料被刪除
解釋: 直接微調只顧降低新任務的 Loss，容易破壞舊能力與安全對齊。
Q: 檢查後訓練成不成功的「局部性」是指？
- 只在本地電腦測試
- *修改一個知識時，不能把其他無關的知識也弄壞
- 只改一小塊螢幕
解釋: 改魯夫的果實，不能讓喬巴的果實答案也跟著變。
Q: 這一課說最高原則是什麼？
- 有問題就重新訓練整個 AI
- *能用「講的」（提示、舉例、給它查資料）解決，就別動手術改參數
- 每天都要微調一次
解釋: 改參數像動腦部手術，風險高又耗算力，應先試 Prompt/ICL/RAG。

【生成式人工智慧與機器學習導論 2025】第 8 講：通用模型的終身學習

📖 家長導讀

本講改編自李宏毅教授《生成式人工智慧與機器學習導論 2025》第八講，談基礎模型釋出後的「後訓練／終身學習」：如何更新知識、賦予新技能、抹除不當資訊，而不觸發災難性遺忘。孩子版用「機器狗、海賊王三檢查、四大絕招、別動手術」呈現；本版補齊四種技術與評估指標。

🔍 完整概念

一、動機與三大評估指標。 動機：更新過時知識、學新技能（如純文字模型學聽語音）、更新價值觀、機器遺忘（因版權或隱私刻意抹除）。評估後訓練須同時滿足：**可靠性（Reliability）**目標被成功修改、**泛化性（Generality）**能舉一反三、**局部性（Locality）**無關知識不被更動。最高原則：最好的後訓練是不做後訓練——先試 Prompt Engineering／In-Context Learning／RAG，真的無效再改參數。

二、梯度下降微調與災難性遺忘。 直接微調最直觀但易「手術成功、病人死亡」。案例：用中文微調 Llama 2 Chat 學會中文卻失去安全防禦（會教駭銀行）；插入語音 Adapter 訓練 3 個 Epoch 後雖能辨識語音情緒卻忘記輸出 JSON 格式。緩解：LoRA（只調少數參數，forgets less 但 learns less）、正規化（對重要參數給大 $λ$ 限制變動）、加入維持原知識的資料（挑不當會使模型變「省話」）、經驗回放（混入原始資料；開源模型多不公開資料，可誘導模型自問自答吐出舊資料）。

三、模型編輯（ROME）。 以人類智慧定位知識神經元再數學編輯。ROME（Rank-One Model Editing）以因果追蹤找出：主體最後一個 token 在中段層（約第 18 層）的前饋網路是觸發輸出的關鍵。以封閉形式解在兩個限制下（輸入 $k^{*}$ 須輸出 $v^{*}$ 、其他知識維持不變）直接算出新參數 $W^{*}$ ，精準改單一知識而不影響他者。

四、模型合併（Task Vector）。 不需額外訓練與大算力，直接對參數加減。任務向量 $τ_{A} = θ_{A} - θ$ 代表某能力。相加得雙重能力（中文向量＋對齊向量加回 Base，兼得中文與安全，繞過微調破壞對齊的問題）；相減做機器遺忘（減去 PTT 語料向量使模型忘記歧視詞）；類比 A−B+C=D（語音辨識中「真實−合成」得到 Syn-to-Real 向量，加到醫療合成語音模型上，得到能處理醫療真實語音的模型，即使從未擁有該資料）。工具如 MergeKit。

五、測試時訓練（TTT）。 突破「先訓練後測試」，在收到測試輸入當下真正更新參數（與 Reasoning 不改參數不同）。方法：搜尋相似歷史資料現場微調客製模型；或半監督最小化輸出熵（TENT、語音的 SUTA，僅需一句測試語音即可降低錯誤率）。連續 TTT 會遭遇 Model Collapse（單筆反覆微調使模型「生鏽」甚至恆輸出同一類別）。解法 Dynamic SUTA 快慢雙軌：Fast Update（單筆臨時微調、用完即拋）＋Slow Update（累積成批做永久更新）＋Model Reset（偵測到崩壞即退回健康版本），方能在連續輸入下穩定降低錯誤率。

✅ 查核筆記（附實證依據）

課程來源：屬實，李宏毅《生成式人工智慧與機器學習導論 2025》第八講。
微調破壞安全對齊：屬實，Qi et al.（2023）〈Fine-tuning Aligned Language Models Compromises Safety〉。
LoRA forgets less, learns less：屬實，Biderman et al.（2024）比較 LoRA 與全量微調的遺忘與學習權衡。
ROME 中層 FFN 儲存事實：屬實，Meng et al.（2022, NeurIPS）因果追蹤與 Rank-One 編輯。
Reliability/Generality/Locality：屬實，為模型編輯領域標準評估維度。
Task Arithmetic（A−B+C）：屬實，Ilharco et al.（2022）〈Editing Models with Task Arithmetic〉。
TTT / TENT / SUTA：屬實，Test-Time Training（Sun et al. 2020）、TENT 熵最小化（Wang et al. 2021）、SUTA 語音測試時調適（Lin et al. 2022）。
連續 TTT 的 Model Collapse 與快慢雙軌：屬合理實務觀察，方向與持續學習文獻一致。

📚 原始出處

【生成式人工智慧與機器學習導論 2025】第 8 講（YouTube）｜李宏毅，國立臺灣大學

🧭 接下來讀這篇

👉 下一關：AI 如何畫畫與唱歌

🔙 回顧：大型 AI 的學習歷程

📋 AI 共學與免責聲明

本教材為 SparkSoul 智慧實驗室家庭共學的實驗紀錄，由 AI 協作萃取整理自公開課程或文獻，家長一起參與閱讀。我們不保證學術上的絕對無誤，鼓勵讀者點擊原始連結進行深度探索；若發現錯誤，歡迎透過 Facebook 粉專告訴我們。涉及醫療、投資或法律等專業判斷，請另行諮詢專業人士。

原始來源

📺 點此觀看原始來源

✨ SparkSoul 自學基地

探索

🐕 機器狗還以為總統是拜登，怎麼辦？

① 為什麼要一直學？學好了怎麼檢查？

② 教 AI 的四大絕招

③ 現場學習，還有最重要的祕密

🏠 生活裡的例子

🎒 今天學到了什麼？

【生成式人工智慧與機器學習導論 2025】第 8 講：通用模型的終身學習

📖 家長導讀

🔍 完整概念

✅ 查核筆記（附實證依據）

📚 原始出處