KZ
bin
Негізгі бет
Қазірдің өзінде танымал
Тікелей эфир
Ұнаған бейнелер
Қайтадан қараңыз
Жазылымдар
Кіру
Тіркелу
Ең жақсы KZbin
Фильм және анимация
Автокөліктер мен көлік құралдары
Музыка
Үй жануарлары мен аңдар
Спорт
Ойындар
Комедия
Ойын-сауық
Тәжірибелік нұсқаулар және стиль
Ғылым және технология
第1课-基本概念(Part1-State,action,policy等)【强化学习的数学原理】
18:48
多智能体强化学习(1/2):基本概念 Multi-Agent Reinforcement Learning
18:37
Побег из Тюрьмы : Тетрис помог Nuggets Gegagedigedagedago сбежать от Nikocado Avocado !
00:18
Как Я Брата ОБМАНУЛ (смешное видео, прикол, юмор, поржать)
00:59
The Ultimate Sausage Prank! Watch Their Reactions 😂🌭 #Unexpected
00:17
ЭКСКЛЮЗИВ: МАЛ екенмін! Некесіз туылған ҚЫЗЫН мойындай ма? 15 мың теңгеге ренжіді!
2:44:02
【一张图讲完强化学习原理】 30分钟了解强化学习名词脉络
Рет қаралды 8,797
Facebook
Twitter
Жүктеу
1
Жазылу 1,4 М.
WINDY Lab
Күн бұрын
Пікірлер: 9
@DanielHuff-w7o
Жыл бұрын
b站看完过来的,赵老师讲的太棒了
@XiayuZhaoXia
7 ай бұрын
Just started watching this course from Prof. Zhao, I'm preparing for my exam of an RL class in my university. I believe this course video collection will definitely help me a lot!
@sunwoe4014
11 ай бұрын
太頂了,原理講的很通透
@senx8758
10 ай бұрын
状态价值更贴切
@飄飄-k1g
6 ай бұрын
小白一枚, 聽了介紹, 差點放棄, 來試試看下一集
@z7089
11 ай бұрын
第一课就感觉质量很高,不知道能不能坚持看下去。。
@kholmsk20
3 ай бұрын
8个月了,你学完了吗?
@keyuan4758
Жыл бұрын
有代码吗
18:48
第1课-基本概念(Part1-State,action,policy等)【强化学习的数学原理】
WINDY Lab
Рет қаралды 2,5 М.
18:37
多智能体强化学习(1/2):基本概念 Multi-Agent Reinforcement Learning
Shusen Wang
Рет қаралды 6 М.
00:18
Побег из Тюрьмы : Тетрис помог Nuggets Gegagedigedagedago сбежать от Nikocado Avocado !
Фани Хани
Рет қаралды 1,9 МЛН
00:59
Как Я Брата ОБМАНУЛ (смешное видео, прикол, юмор, поржать)
Натурал Альбертович
Рет қаралды 5 МЛН
00:17
The Ultimate Sausage Prank! Watch Their Reactions 😂🌭 #Unexpected
La La Life Shorts
Рет қаралды 8 МЛН
2:44:02
ЭКСКЛЮЗИВ: МАЛ екенмін! Некесіз туылған ҚЫЗЫН мойындай ма? 15 мың теңгеге ренжіді!
НТК Show
Рет қаралды 588 М.
45:02
【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (一) - 增強式學習跟機器學習一樣都是三個步驟
Hung-yi Lee
Рет қаралды 78 М.
41:14
【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (二) - Policy Gradient 與修課心情
Hung-yi Lee
Рет қаралды 51 М.
30:03
2027,人類終結 | 老高與小茉 Mr & Mrs Gao
老高與小茉 Mr & Mrs Gao
Рет қаралды 646 М.
41:06
富有的女人在機場羞辱一個樸素的老農夫,因為覺得他身上有味道不配坐頭等艙,結果故事的發展超出了所有人的預料丨溫情故事
灰色未知世界
Рет қаралды 737 М.
22:53
深度强化学习(3/5):策略学习 Policy-Based Reinforcement Learning
Shusen Wang
Рет қаралды 33 М.
14:13
Best Multi-Armed Bandit Strategy? (feat: UCB Method)
ritvikmath
Рет қаралды 42 М.
22:33
Intro to Reinforcement Learning 强化学习纲要 第一课 RL概要 上
Bolei Zhou
Рет қаралды 11 М.
34:41
【機器學習2021】概述增強式學習 (Reinforcement Learning, RL) (三) - Actor-Critic
Hung-yi Lee
Рет қаралды 41 М.
40:01
深度强化学习(1/5):基本概念 Deep Reinforcement Learning (1/5)
Shusen Wang
Рет қаралды 102 М.
18:19
Reinforcement Learning, by the Book
Mutual Information
Рет қаралды 108 М.
00:18
Побег из Тюрьмы : Тетрис помог Nuggets Gegagedigedagedago сбежать от Nikocado Avocado !
Фани Хани
Рет қаралды 1,9 МЛН