【生成式AI】窮人如何低資源復刻自己的 ChatGPT

  Рет қаралды 93,167

Hung-yi Lee

Hung-yi Lee

Жыл бұрын

可以拿來訓練自己的 ChatGPT 的資料集 (由台灣大學學生 Eric Lam 整理)
github.com/voidful/awesome-ch...
感謝黃敬峰先生提供字幕

Пікірлер: 78
@HungyiLeeNTU
@HungyiLeeNTU Жыл бұрын
可以拿來訓練自己的 ChatGPT 的資料集 (由台灣大學學生 Eric Lam 整理) github.com/voidful/awesome-chatgpt-dataset/
@PenutChen
@PenutChen Жыл бұрын
這個應該置頂一下
@l501l501l
@l501l501l 11 ай бұрын
伸手牌問一下,如果自己訓練ChatGPT,用Pytorch train完model,最後的model也會是一個Pickle檔(.pt) 嗎? 然後要使用model的時候(inference),也是initiate後load model,才能開始使用嗎? 我在想如果考量到所有model相關的成本,"小資族"在cloud service開始使用model,除了training的費用,可能還要考慮host這個model的成本(e.g AWS: S3 storage cost, EC2 computation cost). 又或著6~13B size的model,在16GB的ram 可以直接載入,在本地端使用?(抱歉我只使用過BERT,所以希望有人可以提供經驗討論一下,謝謝
@user-ks7kb8qe4s
@user-ks7kb8qe4s 2 ай бұрын
謝謝Eric拯救比較窮的人
@morningstarkalis
@morningstarkalis Ай бұрын
你有沒有興趣加入一個即將提交"發明專利申請書"的核心團隊? 我需要你的專業 我也會提供你的費用 我相信你看過我的發明專利申請書後 你會有極大的興趣
@xaviertsai4063
@xaviertsai4063 Жыл бұрын
上課啦~ 我覺得老師上的課很適合拿來當通識課。淺顯易懂。
@hchsu4765
@hchsu4765 Жыл бұрын
謝謝老師拯救比較沒有錢的窮人
@hyy3657
@hyy3657 Жыл бұрын
老黃:我知道你還有錢買我的顯卡
@yonhlai
@yonhlai Жыл бұрын
难道还有比较有钱的穷人😂
@uartim
@uartim Жыл бұрын
比較窮的有錢人
@carloshsueh9195
@carloshsueh9195 Жыл бұрын
好像沒開打賞功能,不然我真的都想交學費了。感謝老師的整理跟提供insight,這幾篇文章要我自己讀完跟整理最快最快也要兩三天,老師跟團隊讓我們不到半小時就學完了,請收下我的膝蓋 orz
@willy7703
@willy7703 Жыл бұрын
您兩三天就可以整理完 我覺得也是快啦XD
@user-ls9un9uc3t
@user-ls9un9uc3t Жыл бұрын
希望老師可以出完整的線上課程!
@simonliao5020
@simonliao5020 11 ай бұрын
第一次看到字幕。👍👍👍👍👍
@user-uf8qe3ib1r
@user-uf8qe3ib1r Жыл бұрын
老师太贴心了,买不起 A100 的穷人很感动
@user-iw1nz1kc8m
@user-iw1nz1kc8m Жыл бұрын
很喜欢你拍的视频
@ansonchang4196
@ansonchang4196 Жыл бұрын
謝謝老師
@heeheehaha45
@heeheehaha45 10 ай бұрын
李老師好, 有兩個想討論的話題: 1. 語言模型可以用自己生成的答案,變為訓練的數據嗎?如果可以,只要放著他們不管,他們自己也會越變越聰明啊 2. 如果有人把自己的模型放在區塊鏈的智能合約上,對比OPENAI的模型的輸出作訓練,這算不算在法律上抵觸了OPENAI的term of use? 如是,誰要負上責任?區塊鏈上都是無明的。。。 謝謝!
@chenlin7535
@chenlin7535 Жыл бұрын
🥳李老师什么时候讲讲LLM的评估? 感觉太多的营销号鼓吹轻量模型什么什么能和ChatGPT抗衡,但是有没有系统的评估数据
@mibo._.
@mibo._. Жыл бұрын
17:10 Vicuna 看起來表現好的原因會不會只是因為,這個評分標準偏向 Vicuna 當時訓練的 metric,都是使用 GPT-4 來衡量
@HungyiLeeNTU
@HungyiLeeNTU Жыл бұрын
我覺得你說的蠻有道理的,如果當初 Vicuna 訓練的過程中有用 GPT-4 的衡量結果來選擇模型訓練的 hyperparameters,那使用GPT-4 衡量模型會對 Vicuna 有利
@PenutChen
@PenutChen Жыл бұрын
投影片上秀的 Vicuna 參數量是 13B,但 LLaMA-GPT4 的參數量是 7B,這應該也有影響
@Jack-sk9hy
@Jack-sk9hy Жыл бұрын
牛哇牛哇😂 我正在想这个问题!
@nameno7725
@nameno7725 Жыл бұрын
13:30 self-train 成本
@pang-jungliu3663
@pang-jungliu3663 Жыл бұрын
說是窮人但仍然是有錢的窮人….
@hhkk2742
@hhkk2742 Жыл бұрын
大赞🎉❤ 13:30
@bryanshen4930
@bryanshen4930 Жыл бұрын
生產製造機器設備可以數位雙生!那有領域專業的專家是否也可以有一個數位副本?
@run963741
@run963741 Жыл бұрын
最後再把所有 LLM 做 ensemble,LLM 練蠱比賽開始
@nvsrf
@nvsrf Жыл бұрын
现在已经可以 disable chat history, allowing you to choose which conversations can be used to train chatGPT models.
@yuyi9978
@yuyi9978 Жыл бұрын
請問老師如果想參加這些專案需要什麼技能呢?因為本身沒有學過這方面
@thisismuffinmuffin
@thisismuffinmuffin Жыл бұрын
可是在使用chatgpt當老師的時候不是還是會有資料外洩的問題嗎?
@BoChengSu
@BoChengSu Жыл бұрын
話說如果有一點點小錢的話可以去Azure tune一下自己的GPT模型哦🤩
@user-nn8vb4gp4f
@user-nn8vb4gp4f Жыл бұрын
許願成功了~謝謝老師~~~🥳🥳🥳
@user-bk9hm5ce3s
@user-bk9hm5ce3s Жыл бұрын
最後說的那東西不會有 overfitting 的問題嗎
@llrabel
@llrabel Жыл бұрын
真是太有趣了!
@yi-erliao468
@yi-erliao468 Жыл бұрын
訓練完如果沒在訓練,要那麼大的算力嗎?
@user-vt8iu8du6q
@user-vt8iu8du6q Жыл бұрын
看完以後才知道羊駝有那麼多英文單字...
@nking99t
@nking99t 3 ай бұрын
我感觉最麻烦的是整理数据的部分? 假设弄个MedLLM,怎么整理医疗数据。需要很多domain knowledges
@chaower6958
@chaower6958 Жыл бұрын
please help. 請問Dolly 2.0 是NAR還是AR model??? ??? 我看pythia 是拿GPTNeoX來training的感覺是AR model。問cha它老兄跟我說Dolly2.0是NAR。 還是Dolly 2.0是hybrid的?
@chaower6958
@chaower6958 Жыл бұрын
補充一下: 我是想應用NAR 的model像是BART。如果Dolly 2.0 在NAR的領域內表現優可以取代BART,也算是解惑大半了。感謝好心人士的回覆。
@star95
@star95 Жыл бұрын
老師 請教那個ChatGPT復刻下來的模型有多大? 好奇要多大硬碟存儲。 另外一個問題,知識庫的內容部分都已經存在模型裡了嗎? 復刻下來的模型可以斷開Internet 在內網裡正常工作嗎?
@aliendog5134
@aliendog5134 Жыл бұрын
1.刻下來的模型多大要看你用什麼pre train model 2.不太懂你這問題是什麼意思 3.模型載下來基本上就是在你的電腦了 你要部屬到哪裡都可以
@corezhang9353
@corezhang9353 4 ай бұрын
请教一下,这个有没有完整的教程
@fishyang2453
@fishyang2453 Жыл бұрын
比較有錢的窮人🤣
@hsiaosai1120
@hsiaosai1120 Жыл бұрын
簽到
@j1992624
@j1992624 Жыл бұрын
建議換一個麥克風,或是上個cc字幕,感謝
@Weiweii1120
@Weiweii1120 Жыл бұрын
算是符合主題
@zhzhang9660
@zhzhang9660 Жыл бұрын
老师能分享PPT吗
@haoli6628
@haoli6628 Жыл бұрын
就像是Sheldon😂
@rayk5097
@rayk5097 Жыл бұрын
老師都不用休息嗎?😂
@zhengyaolu3893
@zhengyaolu3893 Жыл бұрын
是不是有点像Meta Learning
@majaja7368
@majaja7368 Жыл бұрын
為什麼不跟chat gpt 一樣用網路上的文章訓練,而是要透過chat gpt呢?
@aliendog5134
@aliendog5134 Жыл бұрын
因為chatgpt的資料量非常大 想要自己造一個基本上不太可能 所以就透過 知識蒸餾的方式 來達到復刻的目的
@dandelionsdontfly6422
@dandelionsdontfly6422 Жыл бұрын
出个手把手的教程吧😭
@shenseanchen
@shenseanchen Жыл бұрын
感谢Lee老师! 受教
@hsuchechun9113
@hsuchechun9113 Жыл бұрын
還是不夠有錢😢
@zhongzhongclock
@zhongzhongclock Жыл бұрын
标题改一下:如何通过大只的“草泥马”生成一头小只的“草泥马”,这样可以吸引更多的观众
@drnmss3860
@drnmss3860 Жыл бұрын
这吸引的不是精准用户……
@user-qz4hx6mz1v
@user-qz4hx6mz1v Жыл бұрын
窮人==無法購買數萬組GPU的人
@the_fluffychan
@the_fluffychan Жыл бұрын
「比較有錢的窮人」 😭
@user-gk3ue1he4d
@user-gk3ue1he4d Жыл бұрын
哈哈哈哈哈,总不能自己造电脑 gpu就是了
@s.alikecool8728
@s.alikecool8728 Жыл бұрын
他們是比較有錢的窮人 14:25
@mcluke8092
@mcluke8092 Жыл бұрын
LLM重新定义穷人
@chenwilliam5176
@chenwilliam5176 Жыл бұрын
我是窮人,沒錢 購買 ChatGPT 服務 😢 還是使用 Goggle 😅 熟練後,還是可以 「快速根據自己的意思」 生成報告&論文😃 ---------------- 而且 OpenAI CEO 已經要我們 忘記 ChatGPT-5 😢😢😢😢😢
@Dream-xr7ls
@Dream-xr7ls 7 ай бұрын
現在有 4 pro 了,想必4 pro pro 指日可待
@TankNSSpank
@TankNSSpank Жыл бұрын
666
@incendioraven4269
@incendioraven4269 Жыл бұрын
比较有钱的穷人哈哈哈哈
@user-jx8gj3tv3o
@user-jx8gj3tv3o Ай бұрын
是不是我太弱智了,我完全聽不懂😂
@yray
@yray Жыл бұрын
墙国能复刻么😂
@kouenshi7926
@kouenshi7926 Жыл бұрын
不能換好一點的錄音設備嗎....??????這品質聽3秒就想關掉?????????
@godmaxspeedpot1502
@godmaxspeedpot1502 Жыл бұрын
免費的還嫌
@user-rf9oj9hr9w
@user-rf9oj9hr9w Жыл бұрын
讓別人幫你跑不好ㄇ GPT共用PLUS才75台幣 阿..我不是窮人是乞丐
@user-gn1mh7zv3m
@user-gn1mh7zv3m Жыл бұрын
開頭不是有說,沒看?
@tl7955
@tl7955 Жыл бұрын
看不懂可以不用留言😌
@Nick167507
@Nick167507 Жыл бұрын
在說你是窮人/乞丐之前,邏輯先修好吧
@user-un8wb4zq4y
@user-un8wb4zq4y Жыл бұрын
你懂個屁啊
@bers6034
@bers6034 Жыл бұрын
省流:chatgpt自问自答自评价。
@KenHsiehTW
@KenHsiehTW Жыл бұрын
謝謝老師
【生成式AI】ChatGPT 可以自我反省!
25:45
Hung-yi Lee
Рет қаралды 35 М.
格斗之王!AI写出来的AI竟然这么强!
13:07
林亦LYi
Рет қаралды 679 М.
WHY IS A CAR MORE EXPENSIVE THAN A GIRL?
00:37
Levsob
Рет қаралды 20 МЛН
Would you like a delicious big mooncake? #shorts#Mooncake #China #Chinesefood
00:30
Купили айфон для собачки #shorts #iribaby
00:31
善用ChatGPT,讓專業的你更亮眼 ! | 生成式AI主題論壇
47:51
ChatGPT Tutorial for beginners, 28 tips tricks
33:27
AI进化论-花生
Рет қаралды 347 М.
AI時代,你跟上了嗎?|李宏毅|人文講堂|完整版 20231209
24:01
“影分身之术”!训练50亿次的AI能有多智能
10:19
眼见为识
Рет қаралды 135 М.
Master ChatGPT Prompt in 13 Minutes
13:02
工程師給旅
Рет қаралды 65 М.
iPhone 15 Unboxing Paper diy
0:57
Cute Fay
Рет қаралды 3,5 МЛН
WWDC 2024 Recap: Is Apple Intelligence Legit?
18:23
Marques Brownlee
Рет қаралды 5 МЛН
😱НОУТБУК СОСЕДКИ😱
0:30
OMG DEN
Рет қаралды 3,5 МЛН
Cadiz smart lock official account unlocks the aesthetics of returning home
0:30
WWDC 2024 - June 10 | Apple
1:43:37
Apple
Рет қаралды 10 МЛН
iPhone 15 Pro vs Samsung s24🤣 #shorts
0:10
Tech Tonics
Рет қаралды 13 МЛН