КОД. EDA, РАЗВЕДОЧНЫЙ И ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ | MATPLOTLIB, SEABORN

  Рет қаралды 5,568

machine learrrning

machine learrrning

Күн бұрын

ПЕРВАЯ ЧАСТЬ ЛЕКЦИИ: • EDA, РАЗВЕДОЧНЫЙ И ПЕР...
Курсы на платформе Stepik:
1. Библиотеки Python для Data Science stepik.org/a/129105
2. Введение в нейронные сети (Keras/Tensorflow) stepik.org/a/127274
Анализ данных в машинном обучении очень полезный этап. На второй части лекции рассмотрим код на Python, с помощью которого можно визуализировать данные.
Ссылка на google colab: colab.research.google.com/dri...
EDA на данных с банка
0:00 Введение
0:14 Подгрузка данных
1:07 plt.style.available
1:25 plt.plot - линейный график
3:33 Отрисовка двух линейных графика на одном
3:54 plt.hist - гистограмма (плотность распределения)
4:42 plt.scatterplot - точечный график
5:44 plt.boxplot - ящик с усами
6:13 showfliers - отрисовка без выбросов
6:56 plt.bar - столбчатая диаграмма
7:31 Многорядовые столбчатые диаграммы
8:59 Настаканные (stacked) столбчатые диаграммы
10:12 plt.pie - круговая диаграмма
EDA на данных про недвижимость
10:25 EDA - вводная
11:01 Зачем нужен EDA?
11:33 Шаги первичного анализа данных
11:50 Пару слов про rcParams
12:25 Данные
13:03 1 Шаг EDA. Распределение целевого значения
13:11 Отличие вещественного признака от категориального
14:09 Распределение игрушечного вещественного признака через sns.distplot
15:40 Меры центральной тенденции игрушечного вещественного признака
17:01 Распределение целевого признака
18:09 Меры центральной тенденции целевого признака
18:26 Мода на графике распределения
18:41 Медиана и среднее на графике распределения
19:12 Значение моды не объективно для вещественного признака
19:39 Как вернуть моде вещественного признака адекватность?
19:55 Перевод вещественного признака в категориальный
22:15 Убираем выбросы из целевого признака
23:11 2 Шаг EDA. Анализ признаков
23:20 sns.heatmap - тепловая карта
23:55 Анализ количественных признаков
24:05 plt.hist для поиска выбросов
26:38 sns.jointplot - график взаимного распределения
27:25 Прямая линейная связь
27:41 plt.boxplot для поиска выбросов
28:28 Анализ категориальных признаков
28:36 plt.bar для анализа категорий
29:00 Матрица корреляций
29:12 Обратная линейная связь
29:42 sns.heatmap для матрицы корреляций
30:21 Сильно скоррелированные признаки
30:51 3 Шаг EDA. Анализ зависимости целевого значения от признаков
31:05 Анализ количественных признаков
33:00 sns.pairplot - графики взаимных распределений
33:49 Анализ категориальных признаков
34:20 plt.boxplot для анализа категорий
35:00 sns.violinplot для анализа категорий
35:18 Резюме урока

Пікірлер: 15
@user-eh6rq5zr2b
@user-eh6rq5zr2b 2 жыл бұрын
Отличная подача материала . Спасибо 💚
@user-lh6xe3zi1t
@user-lh6xe3zi1t Жыл бұрын
Вы просто молодец!!! Всё как надо! Очень четко и доступно! 👍👍👍
@nadyamoscow2461
@nadyamoscow2461 Жыл бұрын
Огромное спасибо за ваши видео, очень подробно и познавательно. ТОлько там ошибочка: 29:12 связь между total_rooms и total_bedrooms прямая линейная, а у вас обратная - наверное, потому, что вы случайно поставили минус перед параметром датафрейма в коде, и отрицательные числа на графике сбили вас с толку. Там положительная связь, что показывает и сразу следующий за джойнтплотом heatmap - корреляция 0.93. Но это ерунда, общего отличного качества и ценности ваших видео это не меняет. Я, собственно, это пишу для тех, кто учится - автор не робот, и может ошибиться. Надо думать вместе с ним, а не автоматически копировать материал. Иначе это не учеба, а пустая трата времени. В программировании поиск ошибок в чужом коде даже является дополнительным методом обучения.
@Sergiypsm
@Sergiypsm 7 ай бұрын
Классные лекции! Молодец, умница!
@user-be2pk3tr6l
@user-be2pk3tr6l 2 жыл бұрын
Спасибо большое!
@ilyachepelov1744
@ilyachepelov1744 2 жыл бұрын
Спасибо! Полезно и доступно изложено.
@viyrzn
@viyrzn 2 жыл бұрын
Хорошая подача материала
@fordatascience2810
@fordatascience2810 Жыл бұрын
Спасибо за видео, полезно очень))
@user-jt8wd5en3u
@user-jt8wd5en3u 2 жыл бұрын
Спасибо! Очень интересно и доступно объясняете, а главное сразу показано применение на практике.
@slevinkelevra395
@slevinkelevra395 Жыл бұрын
О, группировка по месяцу можно и так записать кайф, то что надо, спасибо
@machine_learrrning
@machine_learrrning Жыл бұрын
Пожалуйстаю, рада, что нашли полезные группировки! 😊
@user-qc7qh1cc1j
@user-qc7qh1cc1j 5 ай бұрын
Спасибо за видео, у меня сформировалось понимание что от меня будут ожидать. Подскажите пожалуйста, такой анализ как на видео сколько должен занимать времени(часов или дней) у аналитика данных?
@user-lh6xe3zi1t
@user-lh6xe3zi1t Жыл бұрын
А видео без звука или у меня что-то не так?
@user-nc4yd5qy3f
@user-nc4yd5qy3f Жыл бұрын
Добрый день, а в каком приложении пишите код? У меня на macOS стоит анаконда и там юпитер нотбук, у вас как будто выглядит поприятнее и удобнее в использовании…
@machine_learrrning
@machine_learrrning Жыл бұрын
Добрый день! Это google colab - тот же юпитер ноутбук, но на серверах google, про него можете более подробно посмотреть здесь: kzbin.info/www/bejne/i5bRk4uVbNaMm6s
Stupid man 👨😂
00:20
Nadir Show
Рет қаралды 28 МЛН
skibidi toilet 73 (part 2)
04:15
DaFuq!?Boom!
Рет қаралды 32 МЛН
ВИЗУАЛИЗАЦИЯ ДАННЫХ. Трейдинг на Python
15:47
Китобойная
Рет қаралды 7 М.
Stupid man 👨😂
00:20
Nadir Show
Рет қаралды 28 МЛН