Лекция 10. Градиентный бустинг. Открытый курс OpenDataScience по машинному обучению mlcourse.ai

  Рет қаралды 15,210

Yury Kashnitsky

Yury Kashnitsky

5 жыл бұрын

For lectures in English, check out this playlist bit.ly/2zY6Xe2
Это видео совпадает с • Лекция 10. Градиентный... только звук улучшен (Denis Cera)
В заключительной лекции курса мы поговорим про бустинг, AdaBoost и вариации, затем про градиентный бустинг - один из наиболее популярных алгоритмов современного машинного обучения. Напишем бустинг своими руками, обсудим трюки, применяемые в Xgboost и Catboost.
О курсе на Хабре goo.gl/XH9RfL
10-ая тема на Хабре goo.gl/tVFZlh
Jupyter notebooks в репозитории курса goo.gl/PfJKx1
Демо-версия задания bit.ly/3yjPolx

Пікірлер: 22
@mwave3388
@mwave3388 2 жыл бұрын
Спасибо Юрий за курс!
@trojanske_hesten
@trojanske_hesten 3 жыл бұрын
Спасибо за видео, спасибо за курс! Достаточно простым языком объяснены многие основные темы, даны хорошие практические задания. Спасибо!
@festline
@festline 3 жыл бұрын
Спасибо за комментарий! И.. не стесняйтесь советовать курс друзьям :)
@igorkomorkin8671
@igorkomorkin8671 4 жыл бұрын
Спасибо за этот замечательный курс.
@bronislavkonnikov
@bronislavkonnikov 4 жыл бұрын
Огромное спасибо за этот замечательный курс 👏
@salivona
@salivona 3 жыл бұрын
Спасибо!
@nikolaysheregeda7856
@nikolaysheregeda7856 4 жыл бұрын
thx
@user-ki6to9gj4p
@user-ki6to9gj4p 5 жыл бұрын
где можно взять все материалы(данные, теория), используемое за все 10 лекций?
@festline
@festline 5 жыл бұрын
github.com/Yorko/mlcourse.ai
@nmobmaster
@nmobmaster 4 жыл бұрын
А что за темка стоит для подобного отображения графиков matplotlib? Подскажите, пожалуйста, очень понравилось!
@festline
@festline 4 жыл бұрын
вопрос, видимо, про xkcd тему matplotlib.org/xkcd/examples/showcase/xkcd.html
@user-pc6ce4fs3e
@user-pc6ce4fs3e 2 жыл бұрын
Здравствуйте! Не подскажете, почему у вас на 4:26 в функции потерь для logitboost стоит двоичный логарифм? Если ничего не путаю, используется натуральный
@festline
@festline 2 жыл бұрын
Добрый день! Это то же самое с точностью до мультипликативной константы, так что не очень принципиально. Мне в таком виде больше нравится, так как значение в нуле равно 1, как у прочих представленных функций потерь.
@94SERP
@94SERP 4 жыл бұрын
а сейчас вы бы что посоветовали изучать?? XGBoost, LightGBM или CatBoost? Судя по отчетам Яндекса, их бустинг быстрее и точнее на большинстве задач)
@festline
@festline 3 жыл бұрын
я не слежу прям за всеми обновлениями, и лучше всего - вписаться в следующее соревнование на каггле и посмотреть, что люди реально используют. По такой метрике кажется, что гонку выиграл LightGBM
@jjj78ean
@jjj78ean 3 жыл бұрын
вот хорошее сравнение бустингов kzbin.info/www/bejne/aIfEZp2Dgqd2Zq8
@user-fu8yk9pr6k
@user-fu8yk9pr6k Жыл бұрын
Здравствуйте, скажите пожалуйста где можно найти notebook с реализацией градиентного бустинга
@festline
@festline Жыл бұрын
добрый день! Сейчас это задание - в списке бонусных, доступно на Patreon или Boosty mlcourse.ai/book/topic10/bonus_assignment10.html
@user-mx8pn1ky5s
@user-mx8pn1ky5s 4 жыл бұрын
А до сих пор он остался основным в задачах машинного обучения ?
@festline
@festline 4 жыл бұрын
вот прям так обобщать - опасно. Но в случае, когда признаков не очень много (до нескольких тысяч примерно), и признаки разнородные (колич, катег, бинарные) - то действительно чаще всего на практике возьмутся за бустинг. Я лично скорее всего случайный лес проверю, т.к. он менее чувствителен к гиперпараметрам (не надо тратить время на их настройку), но уже в боевых приложениях предпочтение - бустингу из-за времени и памяти.
@user-mx8pn1ky5s
@user-mx8pn1ky5s 4 жыл бұрын
@@festline а бустинг в боевых задачах реализуется либами или каким то другим образом ?
@festline
@festline 4 жыл бұрын
@@user-mx8pn1ky5s чаще это, конечно, lightgm или xgboost, реже - catboost или собственные реализации. В Mail.Ru я работал с боевым бустингом, который в поиске используется
Why You Should Always Help Others ❤️
00:40
Alan Chikin Chow
Рет қаралды 136 МЛН
Just try to use a cool gadget 😍
00:33
123 GO! SHORTS
Рет қаралды 85 МЛН
ОДИН ДЕНЬ ИЗ ДЕТСТВА❤️ #shorts
00:59
BATEK_OFFICIAL
Рет қаралды 7 МЛН
Watermelon Cat?! 🙀 #cat #cute #kitten
00:56
Stocat
Рет қаралды 54 МЛН
Основы машинного обучения, лекция 14 - градиентный бустинг
1:15:12
ФКН ВШЭ — дистанционные занятия
Рет қаралды 2,5 М.
Topic 10. Part 1. Gradient boosting basics
54:17
Yury Kashnitsky
Рет қаралды 10 М.
Машинное обучение 7. Gradient boosting
1:08:01
Лекторий ФПМИ
Рет қаралды 16 М.
Why You Should Always Help Others ❤️
00:40
Alan Chikin Chow
Рет қаралды 136 МЛН