InstructGPT 论文精读【论文精读】

GPT，GPT-2，GPT-3 论文精读【论文精读】

Anthropic LLM 论文精读【论文精读·51】

Как Я Брата ОБМАНУЛ (смешное видео, прикол, юмор, поржать)

Incredibox Sprunki vs Inside Out 2 - Which team will win? #shorts #animation

快乐总是短暂的！😂 #搞笑夫妻 #爱美食爱生活 #搞笑达人

Players push long pins through a cardboard box attempting to pop the balloon!

InstructGPT 论文精读【论文精读】

Рет қаралды 83,783

跟李沐学AI

跟李沐学AI

Күн бұрын

Пікірлер: 60

@frozhen2807 Жыл бұрын

非常喜欢您的讲解。最喜欢的就是您基本没有中英文混着说，纯中文非常不错。

@hongpengjin9435

@hongpengjin9435 Жыл бұрын

感谢老师，不知道是ChatGPT太有趣了还是老师讲解方式好，总之受益匪浅！

@CTT36544 Жыл бұрын

看了你很多视频，发现逻辑清晰，内容可以深入浅出。建议你在这个“论文精度”的playlist之外再开个专门讲DL基础的playlist，保证受欢迎。

@sidolin6671 Жыл бұрын

Mu教Berkley课程 KZbin有

@wayneyue1662 Жыл бұрын

厉害！

@0xsamo Жыл бұрын

太感动了，很喜欢科技的小白，但读不懂论文，简直被戳中G点

@Anewghost Жыл бұрын

雖然大部分我都聽不懂，但還是看完了😂 謝謝你的解說🙏🏻👍🏻

@wayneyue1662 Жыл бұрын

太喜欢了Mu Li 非常需要AI领域精品论文和方法的讲解！

@zyw2134 Жыл бұрын

感谢李哥无私分享~！

@xugangye6494 Жыл бұрын

Here, regarding the pairwise ranking loss, it’s actually based on the softmax probability: P(y_w is preferred over y_l) = exp(r(x, y_w; theta) - r(x, y_l; theta)) / ( exp(r(x, y_w; theta) - r(x, y_l; theta)) + exp(r(x, y_l; theta) - r(x, y_w; theta)) ) So, it’s standard in for ranking model

@blockedao8855 Жыл бұрын

同学们来开组会了

@yanyanzheng4955

@yanyanzheng4955 Жыл бұрын

谢谢大神，一直等着呢

@jingyang4636 Жыл бұрын

谢谢老师的讲解！

@davishuang4010

@davishuang4010 Жыл бұрын

非常棒的講解！！希望你能多出關於chatgpt的影片！！

@lucantang4132 Жыл бұрын

感谢大佬，讲的很清楚🤩

@許逸凱 Жыл бұрын

align台灣這邊會傾向翻譯成校準，中國大陸我之前待過會用對齊這個字，可以給老師參考一下

@danielliang3842

@danielliang3842 Жыл бұрын

补充一个，在大陆的生物信息领域，align翻译为比对

@danielliang3842

@danielliang3842 Жыл бұрын

当然，应该还是对齐更接近英文的字面意思

@ostensibly531 11 ай бұрын

大牛，如果要把chatgpt变成某一领域的expert，应该用这篇文章里的方法还是直接用openai的finetuning api更好?

@quantumjun Жыл бұрын

真喜欢老师的视频

@ghostviper5887

@ghostviper5887 Жыл бұрын

最小工作发布单元真的是高情商描述了：）

@incendioraven4269

@incendioraven4269 Жыл бұрын

🤣

@goldaa4093 Жыл бұрын

😂

@jasonwu6012 Жыл бұрын

感谢您的讲解! 我想请教您： Transformer是个非常漂亮的LLM的突破，给了GPT优秀的语言能力。有论文解释为什么好的语言能力，也等于知识记忆和逻辑归纳能力吗？🙏🙏🙏

@senx8758 Жыл бұрын

逻辑归纳能力主要来自语料记忆。语言模型主要还是文科生

@shuhuijiang361

@shuhuijiang361 Жыл бұрын

请问 RLHF和传统的supervised 找人标groundtruth label是一回事换了个名字吗？还是不同的意思？

@hayama2363 Жыл бұрын

用chatGPT讀GPT的三篇文章可以嗎？

@whoami6821 Жыл бұрын

大佬可以把 divi into deep learning 的课也拌匀刀您频道吗？ B站在美国好像不是很流畅😭

@谢欣-j2f Жыл бұрын

反向代理

@wayneyue1662 Жыл бұрын

B站有课程视频吗，账户名叫啥

@tianyw0 Жыл бұрын

align = 对齐，现已简称“勾对”，即沟通对齐。

@jijie133 11 ай бұрын

Great video!

@changtimwu Жыл бұрын

9:54 是啊, 以後不要再以為 "大力出奇蹟" 了

@liwang-pt4vp Жыл бұрын

在chatGPT无法理解问题的时候，确实提供的答案都是在一本正经的胡说八道

@jacksonchen8679

@jacksonchen8679 Жыл бұрын

step 3 的圖好像在影片上沒有 model 41:37

@pighuizhi7364 Жыл бұрын

沐神，aligned could be translated to 拉通对齐

@achillesarmstrong9639

@achillesarmstrong9639 Жыл бұрын

47:27这里有一个错误哦。4选2是生成6个排序，9选2生成36个排序，所以多了6倍，而不是9倍。这里博主说错了哦

@boyiablefly Ай бұрын

他后面说了，原来的方法是只标最好的，所以只有4种比较关系

@yuli.kamakura Жыл бұрын

强化学习 PPO

@56nxcols89nxci

@56nxcols89nxci Жыл бұрын

align=拉通对齐（华为），简称对齐

@jxitc Жыл бұрын

请问为啥不用已有的问答数据库？比如知乎 quora之类的？

@tokyoaflowertokyo8300

@tokyoaflowertokyo8300 Жыл бұрын

知乎上的数据用来做训练？那训练的结果会很情绪化，喜欢装逼或者喜欢喷人，或者小粉红思维

@jxitc Жыл бұрын

@@tokyoaflowertokyo8300 情绪化装逼或者政治内容请你移步其他地方，我这里是科学讨论。

@qutesoft Жыл бұрын

aligned 翻译的话应该对齐

@fitokay 8 ай бұрын

good

@jokehuang1611 Жыл бұрын

CloseAI 😀

@johnnyhuo8255 Жыл бұрын

学习

@changtimwu Жыл бұрын

14:00 只能說一語成讖了

@alanllz Жыл бұрын

align 通常翻译成对齐？

@yufanz1064 Жыл бұрын

统一思想，意见

@li-pingho1441 Жыл бұрын

awesome!

@yuli.kamakura Жыл бұрын

这个是什么工具呀？

@user-wzb Жыл бұрын

第一次比b站快

@yoshi_from_the_turtleland

@yoshi_from_the_turtleland 7 ай бұрын

57:41

@elementsix1167

@elementsix1167 Жыл бұрын

可以肯定这篇文章主要作者都是华人，排在前三位的很明显是华人的姓氏

@xufenghu3063 Жыл бұрын

🎃

@hujosh8693 Жыл бұрын

你真的看懂論文嗎？一開始就胡說八道了。InstructGPT的重點根本不是標數據，是RLHF和reward model，怎麼你說成一定要標一點數據這種論點？

@deter3 2 ай бұрын

你的专业应该就不是大语言模型方面，讲解的技术洞察力方面极度一般。

GPT，GPT-2，GPT-3 论文精读【论文精读】

1:29:59

GPT，GPT-2，GPT-3 论文精读【论文精读】

跟李沐学AI

Рет қаралды 160 М.

Anthropic LLM 论文精读【论文精读·51】

1:01:52

Anthropic LLM 论文精读【论文精读·51】

跟李沐学AI

Рет қаралды 26 М.

Как Я Брата ОБМАНУЛ (смешное видео, прикол, юмор, поржать)

00:59

Как Я Брата ОБМАНУЛ (смешное видео, прикол, юмор, поржать)

Натурал Альбертович

Рет қаралды 5 МЛН

Incredibox Sprunki vs Inside Out 2 - Which team will win? #shorts #animation

00:30

Incredibox Sprunki vs Inside Out 2 - Which team will win? #shorts #animation

AnythingAlexia

Рет қаралды 22 МЛН

快乐总是短暂的！😂 #搞笑夫妻 #爱美食爱生活 #搞笑达人

00:14

快乐总是短暂的！😂 #搞笑夫妻 #爱美食爱生活 #搞笑达人

朱大帅and依美姐

Рет қаралды 13 МЛН

Players push long pins through a cardboard box attempting to pop the balloon!

00:31

Players push long pins through a cardboard box attempting to pop the balloon!

Daily Viral Brief

Рет қаралды 38 МЛН

Neural Corpus Indexer 文档检索【论文精读】

55:47

Neural Corpus Indexer 文档检索【论文精读】

跟李沐学AI

Рет қаралды 8 М.

【漫士科普】GPT是如何工作的？为什么要学习接下一个词？#gpt #chatgpt #openai

18:52

【漫士科普】GPT是如何工作的？为什么要学习接下一个词？#gpt #chatgpt #openai

漫士沉思录

Рет қаралды 81 М.

Llama 3.1论文精读 · 1. 导言【论文精读·54】

18:53

Llama 3.1论文精读 · 1. 导言【论文精读·54】

跟李沐学AI

Рет қаралды 32 М.

根據科學到底什麼樣的學習方式是最有效率？/ 學習外語的科學

24:40

根據科學到底什麼樣的學習方式是最有效率？/ 學習外語的科學

講三種語言的日本人 Makoto

Рет қаралды 34 М.

中美AI真实差距到底多大？一定要去豪赌中国版Sora吗？谈谈国产大模型AI产业处于什么状态

18:56

中美AI真实差距到底多大？一定要去豪赌中国版Sora吗？谈谈国产大模型AI产业处于什么状态

白呀白Talk

Рет қаралды 92 М.

【人工智能】意识非物理，只存在于大脑构建的梦境中 | 德国认知学家Joscha Bach | AI | 神经元 | 神经网络 | 元胞自动机 | 心智演化 | 创世纪 | 我 | SPIRIT

14:59

【人工智能】意识非物理，只存在于大脑构建的梦境中 | 德国认知学家Joscha Bach | AI | 神经元 | 神经网络 | 元胞自动机 | 心智演化 | 创世纪 | 我 | SPIRIT

最佳拍档

Рет қаралды 10 М.

【科学】Dijkstra算法再被证明是普遍最优算法 | Edsger Dijkstra | 计算机经典算法 | 单源最短路径 | 堆Heap | 工作集属性 | FOCS 2024最佳论文

11:56

【科学】Dijkstra算法再被证明是普遍最优算法 | Edsger Dijkstra | 计算机经典算法 | 单源最短路径 | 堆Heap | 工作集属性 | FOCS 2024最佳论文

最佳拍档

Рет қаралды 51 М.

大模型时代下做科研的四个思路【论文精读·52】

1:06:29

大模型时代下做科研的四个思路【论文精读·52】

跟李沐学AI

Рет қаралды 62 М.

黄仁勋：“别再学编程，如果一切重来，我会学习。。。” 聊聊 AI 阴影下的程序员生存技能 | 回到Axton

14:58

黄仁勋：“别再学编程，如果一切重来，我会学习。。。” 聊聊 AI 阴影下的程序员生存技能 | 回到Axton

回到Axton

Рет қаралды 322 М.

How ChatGPT is Trained

13:43

How ChatGPT is Trained

Ari Seff

Рет қаралды 525 М.

Как Я Брата ОБМАНУЛ (смешное видео, прикол, юмор, поржать)

00:59

Как Я Брата ОБМАНУЛ (смешное видео, прикол, юмор, поржать)

Натурал Альбертович

Рет қаралды 5 МЛН