Полный Пайплайн (Pipeline) || Машинное Обучение

  Рет қаралды 7,780

Аве Кодер

Аве Кодер

2 жыл бұрын

Если не можешь напрямую покупать со Stepik, заказывай отсюда:
avecoders.github.io/ave-coder... Введение в Искусственный Интеллект с Python для Начинающих: stepik.org/a/193579/pay?promo... Введение в Искусственный Интеллект с Python для Начинающих: stepik.org/a/193579/pay?promo... Курс: "Поколение Трансформеров": Нейросети для Естественного Языка (NLP)
Вне Свифта (Россия, Беларусь): stepik.org/a/175490
Свифт (Все остальные): avecademy.teachable.com/p/01596f
Практический Курс по Python:
Stepik: stepik.org/a/126242
Udemy: www.udemy.com/course/avecoder...
Аве Кодер!
Пришло время использовать весь арсенал полученных знаний и построить пайплайн (pipeline) целиком. Мы подгрузим данные, почистим их, разделим на тренировочный, валидационный и тестовый наборы, сохраним их для дальнейшего использования, а затем возьмем модель Случайного Леса (Random Forest) и проведем к-кратную перекрестную валидацию (k-fold cross-validation) на тренировочном наборе, затем используя GridSearchCV мы выберем три набора гиперпараметров показавших лучший результат. Далее, мы испытаем три модели с выбранными гиперпараметрами на валидационном наборе и используя метрики accuracy, precision, recall мы отберем модель с лучшими показателями. И в финале - прогонем ее на тестовом наборе, чтобы получить окончательные результаты.
Код (GoogleCollab): colab.research.google.com/dri...
Разведочный анализ данных: • Разведочный Анализ Дан...
Категориальные признаки: • КАТЕГОРИАЛЬНЫЕ ПРИЗНАК...
Метрики и Кросс-Валидация: • Разделение Данных и Ме...
Переобучение, Недообучение: • Необходимая Теория (Ча...
Гиперпараметры, Регуляризация: • Необходимая Теория (Ча...
#авекодер #машинноеобучение #datascience
Telegram: t.me/avecoder_ru
VK: avecoder
Instagram: / avemundi
Поддержи проект:
www.donationalerts.com/r/avec...
paypal.me/avecoder
/ avecoder
BTC: 1BmLvUFiJaVpCAwhzW3ZwKzMGWoQRfxsn4
ETH: 0x6f1A488c9b12E782AEF74634a40A79b1631237aB
История Технологий:
/ АвеТех
______________________
Аве Кодер!
Меня зовут V и я магистр Искусственного Интеллекта из Великобритании. Здесь на канале ты найдешь только качественные туториалы, подкасты, советы и все такое прочее, а на соседнем канале Аве Тех, есть еще и истории из мира технологий, путешествия по интересным местам и интервью с специалистами из разных тех областей.
Так что ставь императорский палец вверх, подписывайся и бей в колокол!

Пікірлер: 32
@avecoder
@avecoder Жыл бұрын
Практический Курс по Python: Stepik: stepik.org/a/126242 Udemy: www.udemy.com/course/avecoder-advanced-python/?referralCode=270C5D0661A966B53743
@stroganova_irina
@stroganova_irina 2 ай бұрын
спасибо! объясняете доступным языком, это помогает лучше понять тему
@rr1k
@rr1k 7 ай бұрын
понятно и очень наглядно, спасибо. и шутейки между строк очень ок))
@parvizyuldashev4668
@parvizyuldashev4668 Жыл бұрын
Наконец-то нормальный видос о пайплайне. 10 из 10
@user-hh7rb2xm1x
@user-hh7rb2xm1x 2 жыл бұрын
Ты красавец. У тебя стальные нервы. Аве кодер.
@farid5347
@farid5347 2 жыл бұрын
Огромное спасибо! понятно, доступно и просто замечательно.
@sergeyly5438
@sergeyly5438 Жыл бұрын
Жаль раньше не смотрел, великолепный видос
@zoompartyru
@zoompartyru Жыл бұрын
Спасибо, Отличный материал!
@ivan_inanych
@ivan_inanych 2 жыл бұрын
Спасибо, очень доступно
@ambassadornox1919
@ambassadornox1919 2 жыл бұрын
Спасибо ВАМ огромное!!! Я прохожу курс по машинному обучению и у нас такой же датасет Титаник и сделали мы как попало, потом нам дали решение, такие вещи как inplace и все такое - ничего не объясняют. Курсы прохожу онлайн в Германии. Очень нравится эта отрасль и хочу в этом развиваться и работать, но когда курс интенсивный и сто вопросы остаются неотвечаны, то недовольно чувствуешь себя дураком. Спасибо ещё раз, и пожалуйста продолжайте делать видео. Я ещё не добралась до гиперпараметров и их изменений, но хотелось это тоже узнать детально
@andreika6681
@andreika6681 Жыл бұрын
на буткампах лучше такие вещи изучать а не на мооках. wagon в берлине есть, у них отлично сделан вводный курс data science (я прошел и всё что дядя здесь рассказывает у них разбирается в деталях и на практ работах тебе железно вбивается в голову, методы мл даже даются ~ в 3 раза шире) . и в принципе wagon не дорог (или вообще задарма если без работы оказался, государство заплатит).
@muskat9012
@muskat9012 6 ай бұрын
Круто! Скажите пожалуйста если не секрет, картинки в на аватаре в видео чем создавали? Искусственным интеллектом?
@user-pu2xj7tj8i
@user-pu2xj7tj8i 2 жыл бұрын
спасибо тебе. А можешь посоветовать курсы какие на степике или на курсеэре для тех, кто уже знает основы и хочет посмотреть разные направления ( nlp , зрения и т.п)
@avecoder
@avecoder 2 жыл бұрын
Посмотри у Стенфорда есть свой канал с отличными лекциями по этим темам, еще MIT по автопилотам, практика, и у opencv (зрение) и nltk есть свои туториалы в открытом доступе по основам. У меня будет серия практических курсов по теме, но пока неясно с платформой.
@user-nh2no3sf8x
@user-nh2no3sf8x Жыл бұрын
Аве Кодер!
@farid5347
@farid5347 2 жыл бұрын
Помимо RandomForestClassifier() в будущих видео будут рассмотрены другие алгоритмы на примере датасета титаника?
@avecoder
@avecoder 2 жыл бұрын
конечно
@user-yd3ds7jp6e
@user-yd3ds7jp6e Жыл бұрын
Эх, а я думала тут прям пайплайн собираться будет. С преобразователями и прочими приколюхами Еще мне странно наблюдать использование format(). Разве использование f-строки не будет более читаемым, когда все нужные переменные в нужном месте, а не после списком перечислены? Но это так, душню Для новичков видос самое то, 10 из 10
@osvab000
@osvab000 Жыл бұрын
Как всегда лайкос! У меня вопрос: почему все-таки на тесте результаты получились ниже - чем на валидации& Ведь по сути, что те , что другие были взяты из сплита, а именно из X_test, y_test
@avecoder
@avecoder Жыл бұрын
Именно. Это данные, которые наша модель ещё не видела. Возможно, что выборка в валидационном сете была лучше классифицирована, чем в тестовом. Попробуй перезапустить эксперимент с нуля и посмотреть результаты.
@user-kq9cs6lm8c
@user-kq9cs6lm8c 2 жыл бұрын
Спасибо! а будут видео о выводе моделей в продакшн?
@avecoder
@avecoder 2 жыл бұрын
Да, мы постепенно двигаемся в эту сторону - подготовку AI приложений и сервисов.
@alexanderez6115
@alexanderez6115 2 жыл бұрын
скажи пожалуйста, почему ты пол закодировал как 0 и 1, а не использовал one hot encoder?
@avecoder
@avecoder 2 жыл бұрын
ибо у нас всего два категориальных значения. Зачем фигачить вектор там, где можно обойтись скаляром? Если бы полов было скажем 7, то это оправдывало бы использование, ибо использование порядковых числительных не есть гуд, когда у нас нет категориальной связи между значениями.
@alexanderez6115
@alexanderez6115 2 жыл бұрын
@@avecoder а алгоритм может подумать, что 1 лучше чем 0, потому что больше?
@andreika6681
@andreika6681 Жыл бұрын
если тебе вдруг жутко опостылила возня с фичами ты конечно можешь просто зафигачить ohe на всех catеgorical в columntransformer-е и хай pipe ишачит, ну тут разбор задачи для чайников и им полезно показать как всё ручками прописыватся
@ghebodne2644
@ghebodne2644 2 жыл бұрын
Аве V
@mpakoc4722
@mpakoc4722 Жыл бұрын
Accuracy вроде как "качество".
@vladimirmanikhin7918
@vladimirmanikhin7918 Жыл бұрын
А вот зря Name дропнули. Видел статью, где визуализировали корреляцию между выживаемостью и длиной букоф в имени на данном датасете. 1) Сам не проверял =D и 2) Первое, что приходит на ум, скорее всего объясняется большим количеством букоф в женских Неймах, т.е. та же коллинеарность с, извинити, сексом (mrs вместо mr как минимум уже по-дефолту нам даёт +1)
@avecoder
@avecoder Жыл бұрын
Я тоже видел такую теорию, что мол людям более высокого происхождения давали более длинные имена, но а) это всего лишь теория и даже если есть корреляция, то это скорее побочка (то есть корабль Салтыковых-Щедринов и Маминых-Сибиряков должен быть просто непотопляем) б) иностранные имена могут быть априори длинней в) датасет не учитывает вообще команду, предполагая, что она утонула вся, как и скорость с которой команда оказывала эвакуацию (у меня есть второй канал Аве Тех, где я специально поехал в Саутгемптон, чтоб отыскать некоторые могилы затонувших и сравнить с датасетом, там много сюрпризов. Крч сам датасет настолько кукольный, что не учитывает ещё множество немаловажных факторов и уж имя последний из них.
@vladimirmanikhin7918
@vladimirmanikhin7918 Жыл бұрын
@@avecoder благодарю за пояснения !
@naradamyan1678
@naradamyan1678 Жыл бұрын
в следующий раз когда меня спросят чем я занимаюсь я гордо отвечу Бинарный секс 12:25
маленький брат прыгает в бассейн
00:15
GL Show Russian
Рет қаралды 4,3 МЛН
У мамы в машине все найдется
00:38
Даша Боровик
Рет қаралды 2,7 МЛН
Glow Stick Secret 😱 #shorts
00:37
Mr DegrEE
Рет қаралды 132 МЛН
Scikit-Learn Model Pipeline Tutorial
16:50
Greg Hogg
Рет қаралды 23 М.
How do I encode categorical features using scikit-learn?
27:59
Data School
Рет қаралды 136 М.
How I would learn Machine Learning (if I could start over)
7:43
AssemblyAI
Рет қаралды 725 М.
Data Pipelines Explained
8:29
IBM Technology
Рет қаралды 132 М.
Professional Preprocessing with Pipelines in Python
21:48
NeuralNine
Рет қаралды 55 М.
🤖Вернулись в ПРОШЛОЕ🤪
0:28
Demin's Lounge
Рет қаралды 62 М.
Внутренности Rabbit R1 и AI Pin
1:00
Кик Обзор
Рет қаралды 2,2 МЛН
Why spend $10.000 on a flashlight when these are $200🗿
0:12
NIGHTOPERATOR
Рет қаралды 18 МЛН
Вы поможете украсть ваш iPhone
0:56
Romancev768
Рет қаралды 638 М.
How about that uh?😎 #sneakers #airpods
0:13
Side Sphere
Рет қаралды 10 МЛН