Обучение с подкреплением Q-learning, Policy Gradient (Reinforce), Actor-Critic Практика на gym

Рет қаралды 13,177

Күн бұрын

Reinforcement learning является довольно новым и перспективным направлением Машинного обучения. В отличие от Классических методов и Глубокого обучения, по нему есть очень мало материалов и курсов на русском языке, многие из которых написаны очень сложно и мудрено.
На этой лекции преподаватель расскажет доступным языком все основные подходы Обучения с подкреплением.
🤔 Зачем изучать Reinforcement learning? Обучение с подкреплением применяется во множестве прикладных задач: начиная от участия в игровых соревнованиях по Dota2, Starcraft и го, заканчивая управлением технологическими процессами, показом рекламы в интернете и подбором рекомендаций пользователям, игрой на бирже и управлением инвестиционными портфелями. Именно через Обучение с подкреплением лежит путь к сильному искусственному интеллекту.
Практика и все сопутствующие материалы будут выложены на сайте курса plyus.pw/ml2020
Преподаватель курса: ассистент кафедры информатики МФТИ Павел Плюснин.

Пікірлер: 25

@viktorperov9020 6 ай бұрын

Божественная серия лекций, которая раскладывает по полочкам все несвязанные знания. Просмотрел его перед написанием диплома, и неимоверно доволен!

@ЛёликСидоркин 2 жыл бұрын

Такое понятное объяснение по RL, как у Вас, редко встретишь. Все ясно и понятно по ходу лекции. Я слушал Воронцова, хорошо, но сразу не укладывается, нужно повторять. Слушал Нейчева, слишком общо и по верхам. Спасибо Вам за Ваш труд.

@МихаилЮрков-т1э Жыл бұрын

Это одна из самых лучших лекций (если не самая лучшая) по Обучению с подкреплением. Павел, огромное Вам спасибо за Ваш труд. Очень ясное и понятное объяснение, замечательная подача материала, подробное объяснение важных моментов.

@vg835 3 жыл бұрын

шикарное объяснение. спасибо

@vladislavrodin8036 Жыл бұрын

спасибо за лекцию. Многое уложилось в голове именно после ее просмотра

@lucky-twins4213 Жыл бұрын

Очень полезное видео, всё очень четко и понятно объяснили. Прочитала до этого несколько статей по RL, но только после этого видео всё встало на свои места. Благодарю !!!

@ИванКутиков-з8и 4 жыл бұрын

Отлично объясняешь!

@masterpro2288 3 жыл бұрын

Спасибо огромное за ваш труд, лекции очень помогли мне! Только еще если бы была литература с помощью которой вы готовили это материал, что б детальнее разобраться, да и если б вы выложили эти презентации на сайт, тогда б было вообще супер. Но и так спасибо)

@beksaf1088 2 жыл бұрын

Отличное обьяснение. Спасибо

@alexanderalexandrov3972 3 жыл бұрын

первое понятное видео)

@rubi6228 5 ай бұрын

24:49 доллар? поздравляю, вы получаете награду - статус иноагента!

@Елена-к8б8п 2 жыл бұрын

Потрясающая лекция, огромное спасибо! Реально первое понятное объяснение!

@Виктор-н8р7д 11 ай бұрын

Спасибо.

@georgeurumov5673 5 күн бұрын

отличная лекция. есть ли у вас ссылка на jupyter notebook?

@ToshbI4 Жыл бұрын

Лучше, чем куча перечитанных статей. Стоит потраченного времени.

@arsen_i Жыл бұрын

Спасибо за видео. Возник вопрос - когда мы рассматривали на 48 минуте values V1 и V2, не должно ли там где было -1 быть -1+гамма, а где 1 быть 1-гамма?

@Анастасия-ы8ж5ъ 2 жыл бұрын

Спасибо, в целом хорошая лекция ПС: c 50:00 непонятно почему пересчитывая из V2 в V3 клетку с гамма^2 мы получаем гамма^2. Хотя должны получить гамма^2 + гамма