【生成式AI 2023】FrugalGPT: 來看看窮人怎麼用省錢的方式來使用 ChatGPT (上)

  Рет қаралды 36,762

Hung-yi Lee

Hung-yi Lee

Жыл бұрын

下集: • 【生成式AI 2023】FrugalGPT:...
FrugalGPT: arxiv.org/abs/2305.05176

Пікірлер: 27
@HungyiLeeNTU
@HungyiLeeNTU Жыл бұрын
關於Scorer相關的問題,許多人有疑問,我在影片中沒有講清楚。Scorer在訓練過程中需要一定數量的訓練資料,其蒐集方式是將一些問題投入LLM,然後得到LLM的輸出結果,把輸出結果跟正確答案做比對,得知其是否正確,然後來訓練Scorer。為了節省運算資源,在文章中使用了DistilBERT作為Scorer。然而,這篇文章主要是闡述相關概念,有很多問題尚未謹嚴的討論或處理。例如,文中未詳細探討Scorer所需的訓練資源、所需的訓練資料量、以及在任務A上訓練的Scorer是否適用於任務B等問題。
@rayk5097
@rayk5097 Жыл бұрын
我在工作的地方有免費的gpt4, 但是每天只有限使用60次,我也是用這樣的方法。不過有一個缺點就是有時候他的創作性太好,我是用它來寫程式結果他經常會創作一些不存在的function這點真的很困擾。現在我的做法基本上是用它來取代真的寫程式這個步驟把概念放進去讓他幫忙寫,然後再自己做整合,但是真的要call library還是要用Google自己找。
@ansonchang4196
@ansonchang4196 Жыл бұрын
5/9看到這篇paper, 這麼快就看到教授精彩的解說. 感謝!
@pengshancai5973
@pengshancai5973 Жыл бұрын
想请教Hung-yi老师一个问题 为什么现在的大model都采用decoder-only的架构 而不是encoder-decoder 如果可以想听老师讲讲呀!
@dcvsling
@dcvsling Жыл бұрын
我覺得從大多數雲服務都是輸出計價輸入免費的考量來說的話 這應該才是最主要的輸出較貴的理由 至於為何輸入免費 我覺得最合理的理由是 任何產品最終的結果都依定要輸出 所以 在最終階段設下關卡收費很合理 而在輸入處要求入場費會降低入場意願 大多數的外國網路服務都走向面對體驗與開發者友善的路線 所以通常輸入也會比較低或是不用錢 我覺得這是我認為可理解且可接受理由
@user-re3yr8nu9w
@user-re3yr8nu9w Жыл бұрын
请问如何筛选一下有价值的paper呢?能提供一些思路吗?作者和学校,机构选吗
@user-hr7dy6vg7m
@user-hr7dy6vg7m 11 ай бұрын
输入的embedding可以并行计算并且可以cache住,所以输入很便宜,但是输出每一步即使用了kv cache,也是需要前向一次的,所以输出成本更高
@codescv
@codescv 11 ай бұрын
从技术上来说输出比输入贵还是有道理的, 因为decoding需要多少个step只跟输出长度有关, 跟输入长度无关.
@EtherealYuuWriter
@EtherealYuuWriter Жыл бұрын
先跟 openAI 要 2500 可以省一點😂😂
@NierAutomata2B
@NierAutomata2B Жыл бұрын
这个验证模组怎么搞出来的,感觉很关键啊
@johnnieyin6981
@johnnieyin6981 Жыл бұрын
chatgpt系列限制了大家的研究激情… 感觉这样并不好….. 哎…
@chunheikwok6738
@chunheikwok6738 Жыл бұрын
claude 都用它,感覺比gpt4好?
@AIMagician996
@AIMagician996 Жыл бұрын
一些open的问题,怎么设计scorer或者有没有有效的scorer,那就没法用这个方法了
@billstark9506
@billstark9506 4 ай бұрын
第三个方法很容易想到,但是却需要做实验来确定分支结构。
@user-ri9xz1dc6l
@user-ri9xz1dc6l Жыл бұрын
怎么感觉LLM越来越玄学了,现在的一些prompt改进、模型使用方法改进就像玩游戏写攻略一样,完全靠实验啊😂,李老师您怎么看到这种现象啊
@tl7955
@tl7955 6 ай бұрын
主要是因為chatgpt已經取得一個重要的進展,在繼續研究其他可行架構前一些應用實驗也同樣很有價值(對應用來說),同樣有其他架構出現但Transformer(Chatgpt)的進度實在已經走得太遠了,除非又一個game changer否則應該很難再被注意到
@ma3sphere
@ma3sphere 9 ай бұрын
经典系统组思维😅
@willy7703
@willy7703 Жыл бұрын
05:03老師沒辦法想到的原因是因為您是有錢仔吧?(逃
@momo-yw6lg
@momo-yw6lg Жыл бұрын
5:00那里,暗示自己是有钱人。😂
@eyuchang
@eyuchang Жыл бұрын
在把FrugalGPT打成蜂窩前,請仔細檢驗如何訓練一個比GPT4還棒,且便宜的 Evaluator 裁判. 很簡單的一個邏輯問題:如果那裁判那麼厲害又便宜,大家就用那裁判回答問題不就成了嗎?另一個簡單的邏輯問題:甚麼問題是簡單的,甚麼是難得,你能訓練一個判別模組嗎?
@HungyiLeeNTU
@HungyiLeeNTU Жыл бұрын
我認為驗證模組可能可以比生成模型更為簡單,如同 NP 問題可以在多項式時間內被驗證,但其解不一定能在多項式時間內找出。一個具體的例子是,在 instructGPT 的研究中( arxiv.org/abs/2203.02155 ),用於評估輸出好壞的reward model僅有 6B ,明顯小於 GPT-3 。然而,儘管 GPT-3 的大小遠超 reward model,後者依然能夠有效地指導 GPT-3 的學習和進步。
@Fun-bz7ou
@Fun-bz7ou Жыл бұрын
速记单词 frugal=不如狗
@miku3920
@miku3920 Жыл бұрын
窮人不是直接用 chrome driver 執行網頁版 ChatGPT 嗎?
@Cat.the.Roblox.girl.
@Cat.the.Roblox.girl. 3 ай бұрын
窮人直接用bing copilot了,會call API基本上都不是窮人階級,應該說這篇是教你省錢才對
@hudsonvan4322
@hudsonvan4322 7 ай бұрын
GAI 隨機森林
@onedr3591
@onedr3591 Жыл бұрын
真正的穷人都没电脑😂
@li-pingho1441
@li-pingho1441 Жыл бұрын
牛逼
格斗裁判暴力执法!#fighting #shorts
00:15
武林之巅
Рет қаралды 90 МЛН
Black Magic 🪄 by Petkit Pura Max #cat #cats
00:38
Sonyakisa8 TT
Рет қаралды 25 МЛН
【機器學習2021】自注意力機制 (Self-attention) (上)
28:18
【生成式AI導論 2024】第1講:生成式AI是什麼?
29:29
Индуктивность и дроссель.
1:00
Hi Dev! – Электроника
Рет қаралды 1,6 МЛН
Выложил СВОЙ АЙФОН НА АВИТО #shorts
0:42
Дмитрий Левандовский
Рет қаралды 1,4 МЛН
Куда пропал 3D Touch? #apple #iphone
0:51
Не шарю!
Рет қаралды 858 М.
What model of phone do you have?
0:16
Hassyl Joon
Рет қаралды 57 М.