Метрики обучения с подкреплением

  Рет қаралды 892

Центр digital профессий ITtensive

Центр digital профессий ITtensive

Күн бұрын

Запишетесь на полный курс Машинного обучения на Python по адресу support@ittensive.com

Пікірлер: 1
@ЮрийГребеников
@ЮрийГребеников Жыл бұрын
Т.е., если мы выберем действие a1 с меньшим ревардом, то сожалеть будем меньше? 1 / (1+2+3+4) = 0.1 Я вероятно до конца не понимаю, и, возможно, я ошибаюсь, но на данный момент я бы представил сожаление так: ( 5 - a) / ( a1+a2+a3+a4)
ε-жадная стратегия
6:34
Центр digital профессий ITtensive
Рет қаралды 528
отомстил?
00:56
История одного вокалиста
Рет қаралды 6 МЛН
Worst flight ever
00:55
Adam W
Рет қаралды 19 МЛН
Обучение с подкреплением
6:06
Центр digital профессий ITtensive
Рет қаралды 4,1 М.
Стационарность
8:52
Центр digital профессий ITtensive
Рет қаралды 1,1 М.
Сигнал и шум. Цвета шума
8:14
Центр digital профессий ITtensive
Рет қаралды 1 М.
Алгоритмы на Python 3. Лекция №1
1:20:50
Тимофей Хирьянов
Рет қаралды 5 МЛН