KZ
bin
Негізгі бет
Қазірдің өзінде танымал
Тікелей эфир
Ұнаған бейнелер
Қайтадан қараңыз
Жазылымдар
Кіру
Тіркелу
Ең жақсы KZbin
Фильм және анимация
Автокөліктер мен көлік құралдары
Музыка
Үй жануарлары мен аңдар
Спорт
Ойындар
Комедия
Ойын-сауық
Тәжірибелік нұсқаулар және стиль
Ғылым және технология
【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (二) - Policy Gradient 與修課心情
41:14
【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (三) - Actor-Critic
34:41
Would you like a delicious big mooncake? #shorts#Mooncake #China #Chinesefood
00:30
【鬥羅大陸】好好的一家人怎麼會這樣! #斗羅大陸#小舞 #唐舞桐 #唐三 #唐舞麟
00:13
Whyyyy? 😭 #shorts by Leisi Crazy
00:16
Сенің арманың қандай? | 1 серия | 60 кг | Сериал 2024 | Конкурс
26:20
【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (一) - 增強式學習跟機器學習一樣都是三個步驟
Рет қаралды 69,510
Facebook
Twitter
Жүктеу
1
Жазылу 225 М.
Hung-yi Lee
3 жыл бұрын
slides: speech.ee.ntu.edu.tw/~hylee/m...
Пікірлер: 19
@jasonli7480
2 жыл бұрын
谢谢李老师,非常受教!
@hasszhao
Жыл бұрын
看coursera不懂的地方,就来看李老师的视频,回头再看,都明白了。
@wgchris
Жыл бұрын
謝謝老師分享
@user-xq3zw5mh7g
2 жыл бұрын
非常感谢李宏毅老师
@user-cb8gy1sk1q
2 жыл бұрын
被老师的魅力所折服
@haitaozeng4860
3 жыл бұрын
Pretty impressive.
@steven-lin
3 жыл бұрын
Awesome
@difeitang1823
Жыл бұрын
如果输出是连续值,比如角度、力度之类的,怎么办呢
@user-cu6uq5qb2c
2 жыл бұрын
前排板凳
@skywalker0803r
3 жыл бұрын
小板凳坐好了
@williamxing1951
2 жыл бұрын
李老师好,请问RL的随机性和VAE的随机性是类似的吗?VAE里面的z/x也都是从一个normal distribution sample 出来的,这个sample的过程和RL action的sample过程的随机性是一样的吗?
@patrickruan2290
2 жыл бұрын
個人理解:當初始時候,這些 action 可能就是任意一種隨機,可能是 uniform distribution 之類的。在訓練之後,因為網路已經給訓練樣本影響,這時候所謂的隨機是類似 softmax 輸出的某一個隨機,它是根據輸入 s,想要往高 rewards 的一個決定,所以可能的一組輸出隨機向量就是 (right, left, fire) = (0.7, 0.1, 0.2) ,就是說 action right 有 70%.... 這樣的決定跟我們一般 supervised learning 分類器任務是不一樣的,分類器如果輸出 (0.7, 0.1, 0.2) ,會 always 決定 object(0.7),也就是沒有隨機性。
@romanlo8404
2 жыл бұрын
有同學可以說說 RL 跟 heuristic (啟發式) 的區別嗎?怎麼覺得好像有那麼點相像的影子呢~
@sgeusveuev7691
2 жыл бұрын
本质都是makov chain,区别是一个需要训练,一个不需要训练
@Jack-sk9hy
3 жыл бұрын
我来了
@nijiasheng711
2 жыл бұрын
讲的比CS224系列的RL好
@user-xj5fp2be6e
Жыл бұрын
谢谢李老师,有个问题咨询下,您讲了RL不一样的是a1是随机的,所以不一样。 但还没理解为什么要随机?
@user-kg5zj6gn7l
Ай бұрын
引入随机性就是不需要所有的行为都是被计算过的,让随机性的引入会出现新的结果,可能会出现神之一手。又或者是模型对同一种结果不同的判断倒是模型学习到新的可能,增加模型的健壮性。
@KnowNothingJohnSnow
2 жыл бұрын
可憐的小叮噹
41:14
【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (二) - Policy Gradient 與修課心情
Hung-yi Lee
Рет қаралды 45 М.
34:41
【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (三) - Actor-Critic
Hung-yi Lee
Рет қаралды 36 М.
00:30
Would you like a delicious big mooncake? #shorts#Mooncake #China #Chinesefood
MOONCAKE FACTORY
Рет қаралды 82 МЛН
00:13
【鬥羅大陸】好好的一家人怎麼會這樣! #斗羅大陸#小舞 #唐舞桐 #唐三 #唐舞麟
梓俊与唐三
Рет қаралды 16 МЛН
00:16
Whyyyy? 😭 #shorts by Leisi Crazy
Leisi Crazy
Рет қаралды 19 МЛН
26:20
Сенің арманың қандай? | 1 серия | 60 кг | Сериал 2024 | Конкурс
OMIR
Рет қаралды 744 М.
40:01
深度强化学习(1/5):基本概念 Deep Reinforcement Learning (1/5)
Shusen Wang
Рет қаралды 96 М.
36:03
【一张图讲完强化学习原理】 30分钟了解强化学习名词脉络
WestlakeIntelligentRobotics
Рет қаралды 6 М.
35:35
Q-Learning: Model Free Reinforcement Learning and Temporal Difference Learning
Steve Brunton
Рет қаралды 92 М.
16:27
An introduction to Reinforcement Learning
Arxiv Insights
Рет қаралды 642 М.
29:29
【生成式AI導論 2024】第1講:生成式AI是什麼?
Hung-yi Lee
Рет қаралды 165 М.
20:02
【國語】股價預測AI實作,Python程式碼逐行解說,實測結果大公開
解密遊俠
Рет қаралды 115 М.
8:31
才女0基礎學程式設計遊戲!公開超崩潰國外學習過程!|VS MEDIAx @AvaRinVlog
VS MEDIA Taiwan
Рет қаралды 156 М.
1:07:30
MIT 6.S091: Introduction to Deep Reinforcement Learning (Deep RL)
Lex Fridman
Рет қаралды 289 М.
32:00
【機器學習2021】機器終身學習 (Life Long Learning, LL) (一) - 為什麼今日的人工智慧無法成為天網?災難性遺忘(Catastrophic Forgetting)
Hung-yi Lee
Рет қаралды 22 М.
0:59
КОПИМ НА АЙФОН В ТГК АРСЕНИЙ СЭДГАПП🛒
rblx.sedgap
Рет қаралды 1,9 МЛН
13:36
МАГНИТНЫЕ КЛАВИАТУРЫ, МЫШКИ ИЗ МАГНЕЗИУМА, НОВЫЙ СЕНСОР, НОВИНКИ ALIEXPRESS, БЮДЖЕТНЫЕ ДЕВАЙСЫ
FISPECKT
Рет қаралды 148 М.
28:01
МОЩНЕЕ ТВОЕГО ПК - iPad Pro M4 (feat. Brickspacer)
ЗЕ МАККЕРС
Рет қаралды 74 М.
1:00
Самый прочный в мире бюджетный смартфон? 😎 Hotwav Cyber 15
Вэйми
Рет қаралды 2,7 МЛН
0:59
Мечта Каждого Геймера
ЖЕЛЕЗНЫЙ КОРОЛЬ
Рет қаралды 1,2 МЛН
24:46
НЕДЕЛЯ с Sony Xperia 1 V - последний образец ЯПОНСКОГО ЧУДА? | ЧЕСТНЫЙ ОТЗЫВ
Павел Хмурчик
Рет қаралды 60 М.
0:20
iPhone 15 PRO MAX 😈 vs WATCH - FREEFIRE TEST #freefire #watch #iphone15 #smartwatch
Sameer Gaming
Рет қаралды 2,6 МЛН