【生成式AI導論 2024】第7講：大型語言模型修練史 - 第二階段: 名師指點，發揮潛力 (兼談對 ChatGPT 做逆向工程與 LLaMA 時代的開始)

Рет қаралды 47,877

Күн бұрын

因為本週五是 NVIDIA 的團隊來演講，但本週要公告作業五了，為了要讓課程內容可以銜接作業五，我把本週五預定要講的課程內容先行錄影上架。下週是清明連假，所以停更。
投影片：drive.google.c...
延伸閱讀：
LLaMA 2: arxiv.org/abs/...

Пікірлер: 63

@susuky3832 5 ай бұрын

1. 語言模型修練分兩階段: - 第一階段: 自我學習, 通過網路上大量文字資料進行預訓練(Pretrain), 獲得複雜規則與知識 - 有利於微調transfer learning，並提供舉一反三的能力 - 第二階段: 通過人類標註的instruction fine-tuning資料, 發揮語言模型潛力 2. 第二階段 - Instruction Fine-tuning: - 人類準備標註資料(問題+答案)供模型學習 - 讓模型按指令給出正確回應 - 關鍵在於使用第一階段預訓練的參數當作初始參數 - 可使用 Adapter(如 LoRA)技術穩定參數 3. 打造專才 vs. 通才: - 專才: 針對單一任務做 Fine-tuning (translator, editor等)，如BERT - 通才: 使用多種任務資料做Instruction Fine-tuning 4. Instruction Fine-tuning資料收集: - 重點在於高品質的 Instruction Fine-tuning 資料 - 直接收集真實使用者問題並標註答案勝過死板範本 (OpenAI的做法) - 對ChatGPT等大型模型做逆向工程, 生成問答對 (廣為使用) - 資料品質較不佳，但總比沒有好 5. 實驗結果顯示Instruction Fine-tuning: - 不需要大量資料，兩萬多筆甚至數千比足矣 - 對小模型進步尤為顯著 - 使模型穩定且能好好回答問題 6. Llama模型的釋出,使個人/小團隊都可以訓練自己的大型語言模型 - Stanford的Alpaca、一群聯校打造的Vicuna等模型應運而生 7. 代碼實作部分在作業5和作業6將使用Llama模型進行Fine-tuning

@HenryHuang9217 5 ай бұрын

早8課已經過時了早3的課才是王道

@miku3920 5 ай бұрын

看完調一下參數，剛好天亮睡覺

@andrewwu7370 5 ай бұрын

老師你的這堂課就是我的酷東西！

@zackqu7367 4 ай бұрын

老师好！在KZbin上偶然遇到了老师的课，真是太幸运了。您的课程为我开启了一扇大门；

@sichengmao4038 5 ай бұрын

今天有幸在学长的phd答辩会上知道李老师，没想到您还制作了这么多科普视频，好厉害！

@hankdonald7812 5 ай бұрын

0:12 第二阶段：名师指导，发挥潜力 2:02 资料标注，督导式学习Supervised Learning 4:30 督导式学习的标注资料往往太少，成本又太高，不能使语言模型正确回答各式各样的输入问题，所以必须把第一阶段Pre-train训练出来的参数，当作第二阶段Instruction Fine-tuning的初始参数，这样才能确保经过两轮训练后的语言模型准确应付各式各样的输入问题。 9:26 Adapte可使第二阶段Instruction Fine-tuning后得到的参数与第一阶段Pre-train后得到的参数非常类似，并减少运算量。 13:08 正是因为模型在Pre-train中学到了非常复杂的规则，所以模型在经过Instuction Fine-tuning后，就有了很强的举一反三能力。 13:49 以Multi-BERT为例，说明大语言模型的举一反三能力可以有多么夸张。 16:30 Instruction Fine-tuning的两条路线之一：打造一堆专才。 19:42 Instruction Fine-tuning的两条路线之一：直接打造一个通才。 30:41 Instruction Fine-tuning不需要大量资料。是画龙点睛。高品质的Instruction Fine-tuning资料可以通过对chatGPT逆向工程获得。 35:38 Meta的开源大语言模型LLaMA可以作为每个人训练自己大语言模型过程中Instruction Fine-tuning的初始参数。

@panzhang1406 5 ай бұрын

李老师的课好棒

@user-qf2fm4js1z 3 ай бұрын

真有趣

@u4rr837 5 ай бұрын

“Lamma 飛入尋常百姓家”笑死XD

@Terry0319 3 ай бұрын

謝謝老師

@xaviertsai4063 5 ай бұрын

周更已經不能滿足我上課的慾望了😉

@wuhaipeng 5 ай бұрын

太棒了这集。谢谢分享！

@jiezhou-bz5ik 5 ай бұрын

啊，我可太喜欢李宏毅老师辣！最爱听老师的课！

@JC-dj1dt 5 ай бұрын

其他的没看懂，但至少我知道台湾最高的山是哪座了

@不具名人士-l4q 5 ай бұрын

作息破壞者...半夜聽到睡著起床再繼續聽🤣🤣

@黃柏熏-w8z 16 күн бұрын

想請問在 16:27 說到【即使用英文進行fine-tuning，對於回答正確率仍有78%的正確率】。但就圖表而言，把沒有Pre-train資料的QaNet，拿去跟有104 language pre-train資料的BERT model進行正確率比較，會不會失去比較的效果呢？如果【即使用英文進行fine-tuning，對於回答正確率仍有78%的正確率】這句話要成立，是不是應該要有一筆沒有fine-tuning、一筆英文fine-tuning，而經郭微調的模型有顯著提升，才可以成立呢？否則會不會其實BERT在經過pre-train後就已經有78.8%的正確率呢？這僅僅是一個新手的看法，希望有大佬可以回答~~~謝謝

@hefuwei 5 ай бұрын

想問老師：老師這幾年有發佈機器學習還有生成式AI課程影片，對於初學者來說需要從2021年的課程學過來嗎還是直接學最新的課程就好？

@王曦-o3s 5 ай бұрын

李老师，nvidia的的演讲会有录播吗放出吗

@shiuhlinlee 5 ай бұрын

李教授, 希望以後(after the assignment due date)你能分享你的學生作業題. Learning by Doing 這對線上學習是很有幫助的. 謝謝!

@HungyiLeeNTU 5 ай бұрын

所有的作業都會公開在我的課程網頁上 speech.ee.ntu.edu.tw/~hylee/genai/2024-spring.php

@shiuhlinlee 5 ай бұрын

Thanks

@莊智榮-p5z 5 ай бұрын

乖乖上完課了

@3naughtyguy 5 ай бұрын

早上三點就有79個點閱，酷喔，不愧台大

@apprivoise9253 5 ай бұрын

大家真的好認真

@elvis1322 5 ай бұрын

你說錯了，是不愧是李老師

@Guavaava 2 ай бұрын

全世界都在跟李老师学人工智能

@waynej8280 5 ай бұрын

who care 要加s 巨好笑XD

@Sekiro-x7r 5 ай бұрын

看完这个还想看机器学习的课程是看具体哪一年的，我看到2016-2023都有开课（之前没有系统学习过机器学习）

@HungyiLeeNTU 5 ай бұрын

可以考慮先看看 2021 年版的機器學習，是從基本講起，因為是比較最近講的，所以跟今日深度學習的趨勢最接近： kzbin.info/aero/PLJV_el3uVTsMhtt7_Y6sgTHGHp1Vb2P2J 如果喜歡寶可夢的話，可以看 2016 年的寶可夢版： kzbin.info/aero/PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49

@Sekiro-x7r 5 ай бұрын

@@HungyiLeeNTU 感谢李老师

@chinesehotgirl4080 5 ай бұрын

感谢老师，不知后续是否会有多模态，视觉语言模型的内容呢

@lemon94 5 ай бұрын

话说能分享一下作业五吗😶‍🌫

@nanakaka7 5 ай бұрын

21:00 請把Good Bye翻譯成"英文" --> 應該是"中文"🙋‍♀

@afraking7697 5 ай бұрын

請問這系列總共有幾講呢

@HungyiLeeNTU 5 ай бұрын

目前還在連載中，所以還不知道會有幾講

@yangxu9744 5 ай бұрын

什么时候更新哈迫不及待了

@user-hr3dg7yt6b 4 ай бұрын

llama-pro是更好的方法(但更耗資源)

@bhanukumarkotha4270 5 ай бұрын

English please

@ef9754 5 ай бұрын

作息破壞者…

@ChloeHsu-qb5td 2 ай бұрын

歪樓豆知識：布丁在美國是flan不是pudding喔，而且唸起來比較像「府藍」