Обучение с подкреплением Q-learning, Policy Gradient (Reinforce), Actor-Critic Практика на gym

  Рет қаралды 13,177

Pulsar Production

Pulsar Production

Күн бұрын

Reinforcement learning является довольно новым и перспективным направлением Машинного обучения. В отличие от Классических методов и Глубокого обучения, по нему есть очень мало материалов и курсов на русском языке, многие из которых написаны очень сложно и мудрено.
На этой лекции преподаватель расскажет доступным языком все основные подходы Обучения с подкреплением.
🤔 Зачем изучать Reinforcement learning? Обучение с подкреплением применяется во множестве прикладных задач: начиная от участия в игровых соревнованиях по Dota2, Starcraft и го, заканчивая управлением технологическими процессами, показом рекламы в интернете и подбором рекомендаций пользователям, игрой на бирже и управлением инвестиционными портфелями. Именно через Обучение с подкреплением лежит путь к сильному искусственному интеллекту.
Практика и все сопутствующие материалы будут выложены на сайте курса plyus.pw/ml2020
Преподаватель курса: ассистент кафедры информатики МФТИ Павел Плюснин.

Пікірлер: 25
@viktorperov9020
@viktorperov9020 6 ай бұрын
Божественная серия лекций, которая раскладывает по полочкам все несвязанные знания. Просмотрел его перед написанием диплома, и неимоверно доволен!
@ЛёликСидоркин
@ЛёликСидоркин 2 жыл бұрын
Такое понятное объяснение по RL, как у Вас, редко встретишь. Все ясно и понятно по ходу лекции. Я слушал Воронцова, хорошо, но сразу не укладывается, нужно повторять. Слушал Нейчева, слишком общо и по верхам. Спасибо Вам за Ваш труд.
@МихаилЮрков-т1э
@МихаилЮрков-т1э Жыл бұрын
Это одна из самых лучших лекций (если не самая лучшая) по Обучению с подкреплением. Павел, огромное Вам спасибо за Ваш труд. Очень ясное и понятное объяснение, замечательная подача материала, подробное объяснение важных моментов.
@vg835
@vg835 3 жыл бұрын
шикарное объяснение. спасибо
@vladislavrodin8036
@vladislavrodin8036 Жыл бұрын
спасибо за лекцию. Многое уложилось в голове именно после ее просмотра
@lucky-twins4213
@lucky-twins4213 Жыл бұрын
Очень полезное видео, всё очень четко и понятно объяснили. Прочитала до этого несколько статей по RL, но только после этого видео всё встало на свои места. Благодарю !!!
@ИванКутиков-з8и
@ИванКутиков-з8и 4 жыл бұрын
Отлично объясняешь!
@masterpro2288
@masterpro2288 3 жыл бұрын
Спасибо огромное за ваш труд, лекции очень помогли мне! Только еще если бы была литература с помощью которой вы готовили это материал, что б детальнее разобраться, да и если б вы выложили эти презентации на сайт, тогда б было вообще супер. Но и так спасибо)
@beksaf1088
@beksaf1088 2 жыл бұрын
Отличное обьяснение. Спасибо
@alexanderalexandrov3972
@alexanderalexandrov3972 3 жыл бұрын
первое понятное видео)
@rubi6228
@rubi6228 5 ай бұрын
24:49 доллар? поздравляю, вы получаете награду - статус иноагента!
@Елена-к8б8п
@Елена-к8б8п 2 жыл бұрын
Потрясающая лекция, огромное спасибо! Реально первое понятное объяснение!
@Виктор-н8р7д
@Виктор-н8р7д 11 ай бұрын
Спасибо.
@georgeurumov5673
@georgeurumov5673 5 күн бұрын
отличная лекция. есть ли у вас ссылка на jupyter notebook?
@ToshbI4
@ToshbI4 Жыл бұрын
Лучше, чем куча перечитанных статей. Стоит потраченного времени.
@arsen_i
@arsen_i Жыл бұрын
Спасибо за видео. Возник вопрос - когда мы рассматривали на 48 минуте values V1 и V2, не должно ли там где было -1 быть -1+гамма, а где 1 быть 1-гамма?
@Анастасия-ы8ж5ъ
@Анастасия-ы8ж5ъ 2 жыл бұрын
Спасибо, в целом хорошая лекция ПС: c 50:00 непонятно почему пересчитывая из V2 в V3 клетку с гамма^2 мы получаем гамма^2. Хотя должны получить гамма^2 + гамма
@roman445
@roman445 3 жыл бұрын
Здравствуйте, а где можно посмотреть код, который использовался в практике? Заранее спасибо!
@BQ-201
@BQ-201 2 жыл бұрын
Кто может подсказать какая это версия gym ?
@alexanderkurzenkov9679
@alexanderkurzenkov9679 4 жыл бұрын
а где обещанный и анонсированый Actor-Critic???
@plyuspavel
@plyuspavel 4 жыл бұрын
Начиная с 1:49:54
@eduardtsuranov712
@eduardtsuranov712 4 жыл бұрын
@@plyuspavel Практические примеры бы еще на PG, A2C (может даже A3C). Вообще бы красота была! А так Спасибо!!!
@Мы.русские...С.нами.Бог
@Мы.русские...С.нами.Бог Жыл бұрын
Очкарик, найми переводчика себе, потом делай ролики. Этот поток рунглиша невозможно слушать.
@MaysonThorson
@MaysonThorson Жыл бұрын
Иди лапти плети, а не лекции по машинному обучению слушай. Это не твой уровень, раз не понимаешь важность знания терминологии на английском.
@Мы.русские...С.нами.Бог
@Мы.русские...С.нами.Бог Жыл бұрын
@@MaysonThorson А зачем мне знание вашего петушиного сленга? У меня свой язык есть.
Win This Dodgeball Game or DIE…
00:36
Alan Chikin Chow
Рет қаралды 21 МЛН
SCHOOLBOY. Мама флексит 🫣👩🏻
00:41
⚡️КАН АНДРЕЙ⚡️
Рет қаралды 7 МЛН
Лекция №1
1:11:58
Дистанционные занятия МФТИ
Рет қаралды 7 М.
Прикладное машинное обучение 10. Policy gradient.
1:22:51
Лекторий ФПМИ
Рет қаралды 4 М.
Машинное обучение с подкреплением. Лекция №1
1:12:01