Рет қаралды 5,568
ПЕРВАЯ ЧАСТЬ ЛЕКЦИИ: • EDA, РАЗВЕДОЧНЫЙ И ПЕР...
Курсы на платформе Stepik:
1. Библиотеки Python для Data Science stepik.org/a/129105
2. Введение в нейронные сети (Keras/Tensorflow) stepik.org/a/127274
Анализ данных в машинном обучении очень полезный этап. На второй части лекции рассмотрим код на Python, с помощью которого можно визуализировать данные.
Ссылка на google colab: colab.research.google.com/dri...
EDA на данных с банка
0:00 Введение
0:14 Подгрузка данных
1:07 plt.style.available
1:25 plt.plot - линейный график
3:33 Отрисовка двух линейных графика на одном
3:54 plt.hist - гистограмма (плотность распределения)
4:42 plt.scatterplot - точечный график
5:44 plt.boxplot - ящик с усами
6:13 showfliers - отрисовка без выбросов
6:56 plt.bar - столбчатая диаграмма
7:31 Многорядовые столбчатые диаграммы
8:59 Настаканные (stacked) столбчатые диаграммы
10:12 plt.pie - круговая диаграмма
EDA на данных про недвижимость
10:25 EDA - вводная
11:01 Зачем нужен EDA?
11:33 Шаги первичного анализа данных
11:50 Пару слов про rcParams
12:25 Данные
13:03 1 Шаг EDA. Распределение целевого значения
13:11 Отличие вещественного признака от категориального
14:09 Распределение игрушечного вещественного признака через sns.distplot
15:40 Меры центральной тенденции игрушечного вещественного признака
17:01 Распределение целевого признака
18:09 Меры центральной тенденции целевого признака
18:26 Мода на графике распределения
18:41 Медиана и среднее на графике распределения
19:12 Значение моды не объективно для вещественного признака
19:39 Как вернуть моде вещественного признака адекватность?
19:55 Перевод вещественного признака в категориальный
22:15 Убираем выбросы из целевого признака
23:11 2 Шаг EDA. Анализ признаков
23:20 sns.heatmap - тепловая карта
23:55 Анализ количественных признаков
24:05 plt.hist для поиска выбросов
26:38 sns.jointplot - график взаимного распределения
27:25 Прямая линейная связь
27:41 plt.boxplot для поиска выбросов
28:28 Анализ категориальных признаков
28:36 plt.bar для анализа категорий
29:00 Матрица корреляций
29:12 Обратная линейная связь
29:42 sns.heatmap для матрицы корреляций
30:21 Сильно скоррелированные признаки
30:51 3 Шаг EDA. Анализ зависимости целевого значения от признаков
31:05 Анализ количественных признаков
33:00 sns.pairplot - графики взаимных распределений
33:49 Анализ категориальных признаков
34:20 plt.boxplot для анализа категорий
35:00 sns.violinplot для анализа категорий
35:18 Резюме урока