Лекция 1. Pandas. Открытый курс OpenDataScience по машинному обучению mlcourse.ai

  Рет қаралды 83,515

Yury Kashnitsky

Yury Kashnitsky

Күн бұрын

For lectures in English, check out this playlist bit.ly/2zY6Xe2
Это видео совпадает с bit.ly/2pX0KJp, только звук улучшен (Denis Cera, Oleg Butko)
В 1 лекции мы обсудим курс и попрактикуемся в первичном анализе данных с помощью библиотеки Pandas.
Слайды - bit.ly/2ErP7DI
Сайт курса mlcourse.ai
О курсе на Хабре goo.gl/NDG9d2
1-ая тема на Хабре goo.gl/zCZSk2
Jupyter-notebooks в репозитории курса goo.gl/UNsGj5
Демо-версия задания bit.ly/3lWquDp
При организационной поддержке Mail.Ru Group.

Пікірлер: 68
@Igor-sp7tw
@Igor-sp7tw 4 жыл бұрын
Спасибо огромное за курс
@MsTanuffa
@MsTanuffa 4 жыл бұрын
Спасибо!!!! Курс огонь)
@tonibalog
@tonibalog 4 жыл бұрын
Вводная часть заканчивается на 33:10
@Alex-hh5oe
@Alex-hh5oe 4 жыл бұрын
Скорей начинается)
@notyourangevil
@notyourangevil 2 жыл бұрын
Спасибо
@VentureMLops
@VentureMLops 2 жыл бұрын
отличный курс!
@festline
@festline 2 жыл бұрын
Спасибо!
@АндрейМиронов-п2н
@АндрейМиронов-п2н 4 жыл бұрын
Огромное спасибо!!!!
@doniyordjon_pro
@doniyordjon_pro Жыл бұрын
Значит, прогнозируя отток клиента в случае, когда число звонков в сервисный центр больше 3 и подключен роуминг (и прогнозируя лояльность - в противном случае), можно ожидать около 85.8% правильных попаданий (ошибаемся всего 464 + 9 раз). Эти 85.8%, которые мы получили с помощью очень простых рассуждений - это неплохая отправная точка (baseline) для дальнейших моделей машинного обучения, которые мы будем строить. а почему 464+9, немного не понял этот момент
@festline
@festline Жыл бұрын
см. табличку (confusion matrix) выше этой фразы habr.com/ru/company/ods/blog/322626/. 464 записи, где условие не выполняется, но отток все равно был (Churn = 1), 9 случаев - когда где условие выполняется, но Churn = 0.
@doniyordjon_pro
@doniyordjon_pro Жыл бұрын
@@festline спасибо, прочел что значит confusion matrix и понял о чем речь)
@cupcake8145ify
@cupcake8145ify 2 жыл бұрын
Конец перерыва на 1:35:35
@ВиталийСпиридонов-е8и
@ВиталийСпиридонов-е8и Жыл бұрын
Что-то я не особо понимаю Как можно приступить к решению задания с титаником и пр. Где файлы исходные брать.
@festline
@festline Жыл бұрын
Jupyter-ноутбуки - в репозитории курса, конкретно практика с титаником - тут github.com/Yorko/mlcourse.ai/tree/main/jupyter_russian/topic01_pandas_data_analysis. Можно скачать просто .ipynb файл, но лучше склонировать репозиторий и работать в нем. Если есть сложности с гит - вот хороший вводный тьюториал githowto.com/
@ВиталийСпиридонов-е8и
@ВиталийСпиридонов-е8и Жыл бұрын
@@festline Благодарю
@МаксимГолдобин-д9д
@МаксимГолдобин-д9д Жыл бұрын
Здравствуйте, а где-то есть разбор домашек?
@festline
@festline Жыл бұрын
Добрый день! На сайте курса mlcourse.ai/ - демо-задания с решениями. продвинутые домашки, тоже с решениями - за донат на Patreon или Boosty.
@МаксимГолдобин-д9д
@МаксимГолдобин-д9д Жыл бұрын
@@festline Подскажите, как купить продвинутые домашки?
@festline
@festline Жыл бұрын
@@МаксимГолдобин-д9д на главной курса все сылки mlcourse.ai, из РФ проще всего на Бусти boosty.to/ods_mlcourse
@НикитаЕрмолюгин
@НикитаЕрмолюгин Жыл бұрын
Скажите, а где можно найти информацию по поводу индивидумального проекта? Не нашел в репозитории и в конце курса тоже
@festline
@festline Жыл бұрын
это было релевантно для "живых" запусков курса. Вот шаблон в репозитории tinyurl.com/yduabwjb, там же рядом выполненные проекты. Вот еще список тьюториалов и проектов, сделанных во время курса github.com/Yorko/mlcourse.ai/wiki/Individual-projects-and-tutorials-(in-Russian)
@СергейПанченко-ь5н
@СергейПанченко-ь5н 2 жыл бұрын
добрый день, у меня есть сильное ощущение своей тупости, обьясните пожта. как выполнить ДЗ, я перехожу по ссылке, там я попадаю в тетрадку, где мне предлагают внести код отвечая на каждый вопрос, но сами клетки для внесения кода не активны. как быть???
@МаликКадиевНИЯУМИФИИЯФиТ
@МаликКадиевНИЯУМИФИИЯФиТ 2 жыл бұрын
Добрый день. У меня та же самая проблема. Буду очень благодарен если на этот вопрос ответят
@festline
@festline 2 жыл бұрын
Добрый день! Если речь про бонусные задания, то jupyter-book - это read-only формат. Чтоб редактировать, надо запустить jupyter-notebook, сделать копию ipynb-файла и ее уже редактировать. Можно пролистать вводную лекцию по Jupyter на русском, например, в нашем курсе квантового ML semyonsinchenko.github.io/qmlcourse/_build/html/book/pythonblock/python_l3.html
@xxedric6811
@xxedric6811 10 ай бұрын
Доброго дня, Юрий! Хотел бы спросить у Вас, какие книги Вы бы точно посоветовали своим студентам для большего погружения в область?
@festline
@festline 9 ай бұрын
Приветствую! Очень обширный вопрос. Смотря что более интересно - теория? практика? Какая именно область интересна? Тут же от аналитики до хардкорного ML engineering. Я не так много книг сам читал. Из похожего на мой кур посоветую "Machine Learning Simplified" Andrew Wolf. По теории классика - Bishop и Murphy, их все советуют, но я не видел человека, который хоть одну из этих книг реально прочитал.
@xxedric6811
@xxedric6811 9 ай бұрын
@@festline Спасибо за ответ! Возможно Вы когда-нибудь сталкивались с хорошей практической литературой? Имею ввиду следующее: Наиболее популярные курсы и книги сейчас - это сборник теории, подкрепленный довольно простыми практическими задачками. Но реальность такова, что такие знания очень тяжело применять в работе без хорошего наставника, который поделится опытом. Встречали ли Вы курсы/литературу/научные работы, где автор делился бы опытом применения науки о данных к каким-либо большим и непростым проектам?
@festline
@festline 9 ай бұрын
@@xxedric6811 нет, честно - не встречал. Бывают курсы с заточкой на реальные проекты, но книг подобных не видел
@constantinegeist1854
@constantinegeist1854 9 ай бұрын
Т.е. Pandas это, получается, переизобрели Sqlite на корявых Питон-методах с помощью Numpy P.S. посмотрел бенчмарки -- Pandas и медленнее в 1.5 раза...
@festline
@festline 9 ай бұрын
пандас - это намного больше, чем просто SQL. Но да, SQL - это важная его часть.
@ВладиславГаджиханов
@ВладиславГаджиханов 3 жыл бұрын
Актуален ли курс сейчас?
@festline
@festline 3 жыл бұрын
Да, основы анализа данных и машинного обучения не так быстро устаревают.
@kelavr8961
@kelavr8961 Жыл бұрын
@@festline а сейчас?)
@festline
@festline Жыл бұрын
@@kelavr8961 зелен как огурчик!
@kelavr8961
@kelavr8961 Жыл бұрын
@@festline шикарно! Спасибо за труд!
@RusFarFaz
@RusFarFaz 3 жыл бұрын
Этот курс полностью бесплатна и доступна? или есть какая-то закрытая и платная часть?
@festline
@festline 3 жыл бұрын
В текущем виде все доступно и бесплатно. Готовится расширенный набор домашних заданий - за скромный донат, около $10-$15, еще придумаю, как это устроить
@solowawe
@solowawe 3 жыл бұрын
Добрый день! Недавно нашел Ваш курс. Подскажите, почему при попытке скомпилировать в jupyter notebook появляется ошибка name data is not defined ?
@festline
@festline 3 жыл бұрын
Добрый день! по такому описанию непонятно. Вы пытаетесь выполнить "jupyterbook build ."?
@solowawe
@solowawe 2 жыл бұрын
@@festline Добрый день! А скачивать файлы не получится, да?
@festline
@festline 2 жыл бұрын
@@solowawe добрый день! А какие файлы не получается скачать?
@solowawe
@solowawe 2 жыл бұрын
Базы csv
@festline
@festline 2 жыл бұрын
@@solowawe можно пример? Иначе абстрактный вопрос выходит
@МаксимНиколаевич-е6т
@МаксимНиколаевич-е6т 5 жыл бұрын
в ДЗ 1 не получается разделить пол.(adult.data.csv) data[ 'sex' ] == 1 (Male пробовал вместо 1) выдает каждое значение False. К ак мне их разделить? спасибо
@danilzarubin_tv9621
@danilzarubin_tv9621 4 жыл бұрын
pd.crosstab(data[data['sex'] == 'Male']['married'] , data['salary'], margins=True) married - добавленный признак, через lambda или как Вам удобнее
@elenalevasheva3830
@elenalevasheva3830 Жыл бұрын
Спасибо за полезный и интересный проект. А как скачать данные для урока? Если кто знает подскажите, пожалуйста, не могу найти
@festline
@festline Жыл бұрын
Спасибо! Данные можно найти в репозитории курса github.com/Yorko/mlcourse.ai
@ЖанайдарКеттебеков
@ЖанайдарКеттебеков 5 жыл бұрын
А где можно скачать данные beauty?
@festline
@festline 5 жыл бұрын
Course repo github.com/Yorko/mlcourse.ai
@АлександрЛобанов-щ2п
@АлександрЛобанов-щ2п 2 жыл бұрын
на 1:10:00 ошибочка - female это женский пол, а не пол в целом. Поэтому признак должен называться ['sex'] с типом данных "male", "female", а не ['female'].А так за курс спасибо большое, контент и ресурс шикарны! Однозначно лайк!
@alextim7126
@alextim7126 2 жыл бұрын
Это булевая переменная, и поэтому чтобы не путать что подразумевают под 1 а что под 0, называли так.
@andreykomyagin5556
@andreykomyagin5556 2 жыл бұрын
+
@Андрей-о2з7д
@Андрей-о2з7д 5 жыл бұрын
Спасибо, курс хороший, но только по картинкам сложно смысл уловить. Звука то нет.
@festline
@festline 5 жыл бұрын
Включите у себя звук и не смешите людей
@Андрей-о2з7д
@Андрей-о2з7д 5 жыл бұрын
Yury Kashnitsky то громко, то тихо - это разве звук? Насилие над ушами какое-то...
@festline
@festline 5 жыл бұрын
@@Андрей-о2з7д C удовольствием примем ваше предложение на запись курса в студии с профессиональным оборудованием :) И не преувеличивайте - разобрать все можно. Если что, в более свежих лекциях на английском звук лучше
@Олег-ж8м2з
@Олег-ж8м2з 5 жыл бұрын
@@howtowebit8033 дурашка, это же запись лекции, а не видео-урок!
@kuaranir2440
@kuaranir2440 5 жыл бұрын
Тебе блять что в поролоновой комнате надо было записать уроки?
@dmitriidoronin2114
@dmitriidoronin2114 2 жыл бұрын
Отличный курс, автору спасибо
@elenalevasheva3830
@elenalevasheva3830 Жыл бұрын
Спасибо за отличный курс.
@mephistotel87
@mephistotel87 5 жыл бұрын
А как вы так копируете части кода без выделения? Например на 1.40.15 вы скопировали код без return и я нигде не заметил использование мыши или выделение. Как?
@festline
@festline 5 жыл бұрын
сейчас тоже не понимаю, как я это сделал :) наверное просто выделение не отобразилось в трансляции
@nikitainiciative356
@nikitainiciative356 3 жыл бұрын
Здраствуйте, вопрос про слак канал. Есть ли ограничение по возрасту, а то я 4 дня жду ответа
@festline
@festline 3 жыл бұрын
Добрый день! Ограничений нет, заявки в течение недели рассматриваются.
@nikitainiciative356
@nikitainiciative356 3 жыл бұрын
@@festline Спасибо, жду
@andreyhamma4767
@andreyhamma4767 5 жыл бұрын
Почему нельзя объяснить как пользоваться средой разработки, потому что не могу понять как подключить файлы или фото свои ?
@festline
@festline 5 жыл бұрын
mlcourse.ai/prerequisites
Which One Is The Best - From Small To Giant #katebrush #shorts
00:17
when you have plan B 😂
00:11
Andrey Grechka
Рет қаралды 66 МЛН
Самое простое объяснение нейросети
16:30
Программный Кот
Рет қаралды 122 М.
Как Я учил Data Science
13:04
Диванный Аналитик
Рет қаралды 37 М.
How I’d learn ML in 2024 (if I could start over)
7:05
Boris Meinardus
Рет қаралды 1,1 МЛН
SOLID-принципы. Введение в ООП на Python.
1:10:13
Тимофей Хирьянов
Рет қаралды 292 М.
Which One Is The Best - From Small To Giant #katebrush #shorts
00:17