🧒 十歲小孩版

🔗 原始文章:【生成式人工智慧與機器學習導論2025】第3講:解剖大型語言模型 | 台大李宏毅教授

嘿!你有沒有玩過那種「你說一句、我接一句」的接龍遊戲呢?

「今天天氣真——」你可能會接「好」或「熱」對吧?

那你有沒有想過,當你跟 ChatGPT 聊天的時候,它到底是怎麼知道要接什麼字的?它的腦袋裡面到底裝了什麼東西啊?今天我們就要來當個小小科學家,把「大型語言模型」這個 AI 怪獸的腦袋打開來看一看!🔍


🎬 第一站:AI 是怎麼看懂你打的字?

其實 AI 根本看不懂中文或英文!那它怎麼辦呢?

第一步:把句子切成小塊(這叫 Tokenization)

想像你在吃一條吐司,你不會整條塞進嘴巴,你會把它切成一片一片對吧?AI 也是這樣,它會把「我愛吃蘋果」切成「我」、「愛」、「吃」、「蘋果」這種小塊塊,每一塊叫做一個 Token

第二步:查字典,把字變成數字(這叫 Embedding)

AI 的腦袋裡有一本超級厚的字典,每個字都對應到一串神祕數字(像是座標一樣)。

有趣的是,意思相近的字,它們的座標也會靠很近

就像你班上的好朋友下課會坐在一起一樣:

  • 「apple」(蘋果)🍎 旁邊會坐著「蘋果」還有「Cupertino」(蘋果公司總部所在地)
  • 但是大寫的「Apple」(蘋果公司)💻 旁邊坐的卻是「MacBook」和「iPhone」!

🤔 小朋友想想看: 為什麼同樣是 apple,大寫跟小寫的「朋友」不一樣呢?


🏭 第二站:AI 的工廠生產線

接下來,這些數字會跑進一條長長的生產線,就像工廠一樣!

每一個工作站(我們叫它 Layer)都在做一件事:讓這個字更了解它旁邊的字在說什麼

舉個例子:

  • 「我吃了一個蘋果」裡的蘋果 🍎
  • 「我買了蘋果的新手機」裡的蘋果 📱

一開始進生產線的時候,這兩個「蘋果」長得一模一樣。但是越往後面走,AI 就越搞清楚:「啊!這兩個蘋果根本不是同一個東西嘛!」於是它們就會變得越來越不一樣。是不是很聰明?


🎲 第三站:AI 怎麼決定要講哪個字?

當句子跑完整條生產線,AI 會算出一個「誰最可能是下一個字」的排行榜。

比如你打「今天天氣真」,排行榜可能是:

  • 好 → 40%
  • 熱 → 30%
  • 棒 → 20%
  • 香蕉 → 0.001%(幾乎不可能啦!)

這裡有一個超酷的參數叫做溫度(Temperature) 🌡️:

  • 溫度 ❄️:AI 很保守,只敢選最安全的答案
  • 溫度 🔥:AI 變得很大膽,會講一些奇奇怪怪、有創意的答案!

🤔 小朋友想想看: 如果你寫作文想要有創意,你會把溫度調高還是調低?


🧠 第四站:偷看 AI 的小腦袋(最酷的部分!)

科學家超好奇:AI 在「想事情」的時候,腦袋裡到底長怎樣?於是他們發明了幾種偷看的方法!

🔮 讀心術(Logit Lens)

科學家做了一個實驗:叫 AI 把法文「fleur」翻譯成中文「花」。

結果偷看 AI 的腦袋發現——它居然是先想到英文「flower」,最後才翻譯成中文「花」!😲

就像有些人算數學的時候會在心裡先用國語默念一樣,AI 好像是用「英文」在思考事情的耶!

🎭 改造 AI 的個性(表徵工程)

這個超神奇!科學家發現可以在 AI 的腦袋裡裝一個「開關」:

  • 裝上「拒絕開關」➕:AI 會連「教我寫功課」都拒絕你!
  • 拆掉「拒絕開關」➖:AI 就會乖乖回答本來不該答的問題(有點危險喔⚠️)

還有更好笑的——有人找到了「馬屁開關」🤡,打開之後,不管你說什麼蠢話,AI 都會瘋狂稱讚你:「哇!您真是天才!」

🤔 小朋友想想看: 如果你有一個「馬屁開關」可以裝在朋友身上,你會想裝嗎?這樣的稱讚是真心的嗎?


👀 第五站:AI 怎麼「注意」哪個字重要?

AI 裡面有一個超重要的東西叫做 注意力機制(Attention)

想像你在吵雜的福利社裡聽朋友講話,你的耳朵會自動「放大」朋友的聲音,忽略其他人的吵鬧對吧?AI 也是這樣!

當它看到「小明很,他可以拿到最上面的書」這句話,它會特別「注意」這個字跟「拿到最上面」的關係,而不會去管不重要的字。

還有一個小秘密:AI 只能看左邊的字,不能偷看右邊! 👈

因為 AI 是一個字一個字生出來的,它根本還不知道右邊會有什麼字,就像我們玩接龍的時候也不知道下一個人要接什麼一樣!


🏋️ 第六站:AI 有多大隻?

我們來看兩個 AI 怪獸的身材比一比:

比一比Llama(Meta 做的)🦙Gemma(Google 做的)💎
總共有幾個「腦細胞」32 億個!43 億個!
認識幾個字12 萬多個26 萬多個(多兩倍!)
生產線有幾站28 站34 站

32 億個參數是什麼概念?如果每個參數是一粒米,可以裝滿好幾個大浴缸呢!🛁


📝 今天學到了什麼?

  1. AI 看不懂字,它看的是數字:它會把字變成一串神祕座標,意思相近的字座標會靠很近。
  2. AI 有一條很長的生產線:每一站都讓字更了解前後文,越到後面越聰明。
  3. AI 用「機率」決定下一個字:溫度調高會有創意,調低會很保守。
  4. 科學家可以偷看 AI 的腦袋:發現 AI 可能是用英文在思考事情的!
  5. AI 的注意力會自動聚焦:它會自己判斷哪些字比較重要,但只能看左邊,不能偷看右邊的答案。

下次你跟 AI 聊天的時候,就可以想像它腦袋裡這些神奇的運作囉!是不是覺得 AI 也沒有那麼可怕,反而還有點可愛呢?😊


📺 原始影片觀看原始影片



📋 來源聲明:本教材為非營利教育用途的高度轉化作品。原始出處標註於家長版中。