从零开始学习大语言模型(二)

  Рет қаралды 51,032

林亦LYi

林亦LYi

Күн бұрын

Пікірлер
@shih-binshih9889
@shih-binshih9889 6 ай бұрын
對於一個小白來說,我對您的分享只有滿滿的感謝,透過您的影片,我能夠看到一些些我原本這輩子都不可能理解的理論!
@JeffLee-r6u
@JeffLee-r6u Ай бұрын
片尾听到了好熟悉的背景音乐,RYU的通关音乐,谢谢让我回忆起了小时候。
@freewhver
@freewhver 7 ай бұрын
林毅的课让我知道了神里绫华是谁😂
@sungkyungchoi
@sungkyungchoi 6 ай бұрын
博主是,抖m😅😅
@puzhaotang479
@puzhaotang479 4 ай бұрын
博主二次元粉,功能已废
@AS-wx1pm
@AS-wx1pm 7 ай бұрын
谢谢。期待下期!
@leonardoy5088
@leonardoy5088 5 ай бұрын
4:13 这么说Interestelar (星际穿越) 里碰那本书格局小了,直接控制电流用晶体管打字格局打开。
@35likaikou
@35likaikou 7 ай бұрын
lollipop換成popillol好像沒錯丫?
@Elon66688
@Elon66688 7 ай бұрын
同问
@FuxiHuoxi
@FuxiHuoxi 7 ай бұрын
视频里没错 林哥说的是有些ai可能出错是按lol li pop 为词粒度倒过来
@wizist
@wizist 7 ай бұрын
@@FuxiHuoxi 這牽強了,為什麼不用其他 AI 演示呢?
@sy-ej7ms
@sy-ej7ms 7 ай бұрын
應該問何謂倒過來 qoqillol loll!bob 這兩算不算倒過來
@hankdonald7812
@hankdonald7812 7 ай бұрын
lollipop,如果按照字粒度划分,并倒过来写,就是popillol,这样是正确的。如果按照lol,li,pop这样的子词粒度划分,然后再倒过来写,就是poplilol,这样就是错误的。
@ErginMelek
@ErginMelek 4 күн бұрын
求博主分享Seq2Seq数据清洗教程!
@趙軒磊-q7z
@趙軒磊-q7z 7 ай бұрын
省流:我是神里綾華的狗
@harryying4507
@harryying4507 7 ай бұрын
非常易懂!希望坚持
@chenzhi-th2oy
@chenzhi-th2oy 7 ай бұрын
先赞后看,持续追更
@dereksun3789
@dereksun3789 13 күн бұрын
没有下一期了吗?
@chumenworld
@chumenworld 3 күн бұрын
第三部,咋没了?这么好的AI通识课!
@hongzeng6081
@hongzeng6081 5 ай бұрын
等第三期👏
@markxin-z6u
@markxin-z6u 2 ай бұрын
林哥哥啥时候出这个系列第三期
@SeanChay
@SeanChay 5 ай бұрын
幾時上第三集?🙈
@cyshall
@cyshall 7 ай бұрын
林哥可以把大模型相关的教程单独放一个播放列表吗,省得翻找了可以随时复习
@hello松子
@hello松子 5 ай бұрын
期待下一集~
@rogetsun3656
@rogetsun3656 7 ай бұрын
终于有第二集了 哈哈
@peterwa5266
@peterwa5266 2 ай бұрын
期待下一集
@feifeishuishui
@feifeishuishui 7 ай бұрын
13:55 n-gram 这个地方没看懂,”我是“ 或者“是神里绫华”像 这个两个在自然语言里不一定经常出现的向量怎么做到简单地用第一位和第二位的1 来表示的,
@sy-ej7ms
@sy-ej7ms 7 ай бұрын
編碼把(我+是)這兩個變成一組 表示為1 (是+神里)也表示為1 當出現(神里+是)(狗+是)這種組合時就會是0
@feifeishuishui
@feifeishuishui 7 ай бұрын
@@sy-ej7ms 这个理解,但是要让电脑知道这类组合每一种分别是什么意思,你才能用1或者0来替代。那你得要有个多大的词库来装这么多组合
@sy-ej7ms
@sy-ej7ms 7 ай бұрын
​@@feifeishuishui 不需要新的詞庫兩個一組是人為定義的,也可以三個一組,額外再多發出一段位置編碼,有文字編碼跟位置編碼,而位置編碼是不用詞庫的,必須同時符合兩種編碼才是正確輸出
@feifeishuishui
@feifeishuishui 7 ай бұрын
@@sy-ej7ms 有道理,学习了
@meowalien4160
@meowalien4160 7 ай бұрын
@@feifeishuishui Term frequency (TF)
@許哲豪-v4m
@許哲豪-v4m 7 ай бұрын
11:11不過確實這種解法也是最符合人類邏輯的,正常人應該也不會去數一個字裡有幾個字母,叫我把lolipop反過來我第一個想到的也是poplilo😂
@kenshinhu2823
@kenshinhu2823 7 ай бұрын
这集看起来是引出下一集Bert和GPT内容了
@ΥγρόΠυρ
@ΥγρόΠυρ 3 ай бұрын
讲的太好了 下一课呢
@郝赫-r3s
@郝赫-r3s 6 ай бұрын
啥时候出第三期?
@tonyqin6737
@tonyqin6737 6 ай бұрын
第三集什么时候出来?
@zhenhongxue
@zhenhongxue 6 ай бұрын
谢谢您的分享
@nandychen
@nandychen 6 ай бұрын
干脆利落,棒!
@Henry-pj6gz
@Henry-pj6gz 7 ай бұрын
希望之後的影片會是dark mode
@loltou1
@loltou1 6 ай бұрын
可以做個AI克隆人的教學
@boilingwater8365
@boilingwater8365 Ай бұрын
还更新吗
@CoraYe-n3h
@CoraYe-n3h 7 ай бұрын
艾玛你终于来填坑了
@pgmsia2516
@pgmsia2516 7 ай бұрын
加油 👏👏👏
@guguwarcheif1123
@guguwarcheif1123 7 ай бұрын
大佬,请问没有好的电脑,不过有10几台老电脑,有没有方案可以来跑ai。
@windxcrypto
@windxcrypto 5 ай бұрын
把10台卖了买台好的吧
@puzhaotang479
@puzhaotang479 5 ай бұрын
几个月后,终于看到了(二)
@wyek1n
@wyek1n 27 күн бұрын
催更
@张生-u2r
@张生-u2r 7 ай бұрын
成功的抢到了沙发啦
@stevencaulfield6042
@stevencaulfield6042 7 ай бұрын
线代是机器学习的基础之一
@ZechWu
@ZechWu 7 ай бұрын
聽到一半好像快懂了,聽到最後全矇了😂
@艾菜雞
@艾菜雞 7 ай бұрын
可以先学语言模型演算法 会更好懂
@CoraYe-n3h
@CoraYe-n3h 7 ай бұрын
结尾这里我没太听明白。。。就是词袋编码和向量相似度这里😂😂
@TheLucky368368
@TheLucky368368 5 ай бұрын
​@@CoraYe-n3h ​ @user-yf6vm4rz5g ​ 詞袋編碼是為了解決每個字的位置都用向量表達,導致訊息密度低還有計算困難的問題。 詞袋編碼捨棄用位置作為向量的訊息紀錄方式,而是計算每一個token在句子中出現的次數,增加訊息密度的同時還能解決計算困難的問題。 訊息密度要想像一下,如果我有一篇文章,裡面有十萬個「我喜歡貓」的句子,那位置向量的維度就會是4*10萬,就是40萬個維度。但改用詞袋編碼的話,向量維度直接縮減至4個維度,若以token計算更可能因為「喜歡」被視為一個token而把詞袋縮減至3個維度。考慮最極端的情況,即便一篇文章中的字跟標點符號完全不重複,使用詞袋編碼的維度也絕對小於等於使用位置向量的維度。 由前述可以知道,詞袋編碼的目的是為了縮減維度,除了提升訊息密度外,同時也能減少計算難度,因為如果向量維度太高,矩陣乘法會超級慢,因為矩陣乘法的計算速度以指數級成長。 也不能只單看詞袋編碼,要跟n-gram一起看才會懂,如果只有詞袋,那麼「我吃了漢堡」跟「漢堡吃了我」會因為token數量一致而使模型誤判成兩個句子是等價的,因為token數量一致,所以需要有n-gram這個滑塊(sliding window)一次滑過n個token來確定token的先後順序。 再來說說向量相似度,這是一種評估兩個向量相不相似的方式,影片中的用途比較像是評估兩個句子的相似程度。 舉例來說,我們判斷任意兩個人相不相似可以透過選定某幾項指標來判定,像是身高、體重與年齡等。把兩個人的身高、體重與年齡取差值後相加,數值小的代表兩個人相似。 向量也是一樣的,需要有幾個指標才能判斷任意兩個向量的相似程度,像是可以選擇向量的長度與兩向量夾角作為判斷相似度的依據。 簡單的幾何想像是,在空間中有兩條具有指向性的直線,判斷兩條直線相不相似只要根據他們的長度跟夾角就可以了,像是可以定義長度差距越小、夾角越小代表兩向量的相似程度越高。 BTW,有興趣的話可以去看看線性代數中的向量空間與內積空間,這兩部分很完整的定義了什麼是向量的長度與夾角,因為只要符合規範就可以形成空間,所以長度與夾角不是只有唯一一種計算方式。
@bon_come
@bon_come 7 ай бұрын
好希望有一個AI可以完全取代我做事
@lyeeonardolll2672
@lyeeonardolll2672 6 ай бұрын
什么时候有3啊,急需,老板要我给他解释LLM
@强国学习
@强国学习 7 ай бұрын
大模型不适合个体,你要是能开发一个框架,教AI怎么玩游戏,我觉得更有钱景~
@劉聖龍
@劉聖龍 7 ай бұрын
不知道是不是我的耳機問題,一直感覺背後有回音像是待在一個空房間的角落講話一樣
@stevencurry995
@stevencurry995 6 ай бұрын
谢谢谢谢谢谢
@justinmoh_
@justinmoh_ 7 ай бұрын
啊,下一集不会是 GPT5 都已经出了吧
@yougikou
@yougikou 7 ай бұрын
岂不是中文用单个字做训练的话,就没有子词的优势了。因为中文是依赖部首比较大的语言啊
@youjunliu8463
@youjunliu8463 7 ай бұрын
林哥出現啦!
@晏波-k6d
@晏波-k6d 6 ай бұрын
意思人类语言对于计算机来说是狗叫😂
@JianWang-q8j
@JianWang-q8j 7 ай бұрын
桌子和房间一样宽,你是怎么进去的?
@cxpjamescxp
@cxpjamescxp 7 ай бұрын
这期的麦克风是不是有点问题
@s010860s
@s010860s 7 ай бұрын
深入淺出 牛啤
@Lyn19820327
@Lyn19820327 7 ай бұрын
好视频
@sidega5397
@sidega5397 6 ай бұрын
追更ing
@j8ge
@j8ge 7 ай бұрын
期待已久
@johnwilson5977
@johnwilson5977 3 ай бұрын
催更!!!!!!!!!
@cashbbq5064
@cashbbq5064 7 ай бұрын
認真聽完後學到了,你是那個誰誰誰的狗。😂我的學習能力趨近於零⋯⋯
@fff-zg1kr
@fff-zg1kr 7 ай бұрын
上了一堂免費的課
@alexhuang3965
@alexhuang3965 7 ай бұрын
为什么整个视频看完我,我脑海里就只有一句话:好想被神里小姐踩在脚下啊。请问我是看了一期假的AI学习视频吗🤣
@jerryjerry666
@jerryjerry666 7 ай бұрын
接下来就是word2vec了
@ciciy-wm5ik
@ciciy-wm5ik 5 ай бұрын
林亦应该是个m没跑了
@杨直刚
@杨直刚 7 ай бұрын
居然不让我坐,就因为我不好看
@Yiliu
@Yiliu 7 ай бұрын
实在不行,你就割我一波儿吧,199换你做视频有点儿压力😂
@duanlang119
@duanlang119 7 ай бұрын
答辩啥意思
@bearfish1999
@bearfish1999 7 ай бұрын
依託答辯
@freewhver
@freewhver 7 ай бұрын
@@bearfish1999我说我孩子怎么最近总在说拉答辩😅
@TimCook-mh6bt
@TimCook-mh6bt 7 ай бұрын
就是大便😂
@PIKA_Ox1
@PIKA_Ox1 7 ай бұрын
我最近要在教授面前答辯 論文了,有什麼要注意的嗎
@MrCoffeerify
@MrCoffeerify 7 ай бұрын
还是这学习高清呀
@weichen6451
@weichen6451 7 ай бұрын
本期目标:我是狗
@muyuanliu3175
@muyuanliu3175 7 ай бұрын
这个学习速度实在是不能算快
@hongjic
@hongjic 7 ай бұрын
深入浅出,膜
@leonz2484
@leonz2484 7 ай бұрын
好像只是了解性知识,本人比较愚钝没有看出更深一层的玄机。
@syr1145
@syr1145 6 ай бұрын
看完了,恩,玩原神去
@蔡翔宇-k1b
@蔡翔宇-k1b 7 ай бұрын
汪汪
@lyz3581
@lyz3581 7 ай бұрын
我是女友的狗
@Jack-Y-J
@Jack-Y-J 7 ай бұрын
我的学习总结:你想被神里绫华踩在脚下。 你是LSP
@Yuhuangshangdi
@Yuhuangshangdi 3 ай бұрын
这玩意听上去很蠢,AI只能从哲学的角度切入,在用技术的方式表示,否则,根本就不是智能,而是技术。
暴雷的英特尔,烂尾的芯片法案?
14:19
林亦LYi
Рет қаралды 76 М.
СИНИЙ ИНЕЙ УЖЕ ВЫШЕЛ!❄️
01:01
DO$HIK
Рет қаралды 3,3 МЛН
小丑女COCO的审判。#天使 #小丑 #超人不会飞
00:53
超人不会飞
Рет қаралды 16 МЛН
Try this prank with your friends 😂 @karina-kola
00:18
Andrey Grechka
Рет қаралды 9 МЛН
从零开始学习大语言模型(一)
20:13
林亦LYi
Рет қаралды 242 М.
大器晚成!苹果芯片“失败”史
26:14
林亦LYi
Рет қаралды 10 М.
80分鐘快速了解大型語言模型 (5:30 有咒術迴戰雷)
1:32:10
为什么游戏越来越不好玩了 V2.0
29:28
林亦LYi
Рет қаралды 150 М.
AI战争:消灭谷歌暴政,搜索属于微软!
39:30
林亦LYi
Рет қаралды 208 М.
Transformers (how LLMs work) explained visually | DL5
27:14
3Blue1Brown
Рет қаралды 4,2 МЛН
人工智能与人类终局
30:32
林亦LYi
Рет қаралды 81 М.
【生成式AI導論 2024】第1講:生成式AI是什麼?
29:29
我让AI学了两万条B站评论!大战弱智吧!
15:34
林亦LYi
Рет қаралды 188 М.
СИНИЙ ИНЕЙ УЖЕ ВЫШЕЛ!❄️
01:01
DO$HIK
Рет қаралды 3,3 МЛН