Лекция 6. Проверка статистических гипотез (процедуры Python)

  Рет қаралды 24,187

Computer Science Center

Computer Science Center

5 жыл бұрын

compscicenter.ru/
Проверка статистических гипотез (процедуры Python).
Критерий Шапиро-Уилка. Критерий Манна-Уитни-Вилкоксона. t-критерий Стъюдента. Критерий Флигнера-Килина.
Независимые и парные выборки. Критерий хи-квадрат. Критерий Пирсона.
Лекция №6 в курсе "Анализ данных на Python в примерах и задачах. Часть 1" (весна 2018).
Преподаватель курса: Вадим Леонардович Аббакумов

Пікірлер: 16
@rittervsp
@rittervsp 5 жыл бұрын
Прекрасные лекции, спасибо большое!
@pavelsch1984
@pavelsch1984 8 ай бұрын
О, как хорошо, что я наткнулся на Ваши лекции! Теперь изучение пайтона для анализа данных пойдет бодрее)) Для обработки пропущенных данных я бы применял предварительную фильтрацию по notna, наверное)
@kedr123
@kedr123 2 жыл бұрын
Спасибо за лекции. Просьба скинуть ссылки на джупитер-ноутбуки с лекциями.
@user-eg1vy8pk1v
@user-eg1vy8pk1v 3 жыл бұрын
А где скачать ноутбук ?
@superspectrum625
@superspectrum625 Жыл бұрын
а где можно найти ноутбук?
@tka400
@tka400 3 жыл бұрын
Если в задаче на цветовое восприятие (28:49) проверить гипотезу о нормальности, то действительно распределения нормальны Шапиро Уилка - тест на нормальность распределения p-value 0.7196102142333984 p-value 0.8271005749702454
@Vadim_Abbakumov
@Vadim_Abbakumov 3 жыл бұрын
Совершенно верно, но даже если оба раза гипотеза нормальности была бы отвергнута, я все равно применял бы критерий Стьюдента, потому что отклонения от нормальности несущественные. Пожалуй надо в новых курсах говорить об этом подробнее...
@FilSerge
@FilSerge 3 жыл бұрын
@@Vadim_Abbakumov А как можно качественно оценить отклонение от нормальности? Тем же p-value по Шапиро? Спасибо вам за прекрасные лекции (вижу как вы с каждой иттерацией повышаете их уровень)! Интересно видеть, что вы ещё и на обратную связь реагируете.
@Vadim_Abbakumov
@Vadim_Abbakumov 3 жыл бұрын
@@FilSerge p-value количественная оценка, число. Качественную картину дают P-P графики и Q-Q графики (P-P plots, Q-Q plots)
@FilSerge
@FilSerge 3 жыл бұрын
@@Vadim_Abbakumov О, большое вам спасибо за ответ. В прошлый раз не удалось до такого догуглиться. Может в этот раз получится предметнее. Ещё раз спасибо!
@dazdess
@dazdess 2 жыл бұрын
Можно заполнить данные средними или медианными значениями. Тогда и пропускать там нечего.
@user-nw9dx4fj9s
@user-nw9dx4fj9s 3 жыл бұрын
Здравствуйте! В примере с продолжительностью жизни аристократов и королей в лекции приняли решение о нормальности распределения основываясь на гистограммы, я попробовал Шапиро и результат показал p-значение на много меньше альфы, попробовал прологарифмировать данные, и все равно pvalue=1.896729783092047e-32, я кажется что то не так понимаю, в чем моя ошибка скажите пожалуйста.
@Vadim_Abbakumov
@Vadim_Abbakumov 3 жыл бұрын
В лекции приняли решение о несущественности отклонения распределения от нормального. Требование нормальности распределения на практике заменено на требование отсутствия существенных отклонений.
@user-nw9dx4fj9s
@user-nw9dx4fj9s 3 жыл бұрын
@@Vadim_Abbakumov понял, спасибо!
@Vadim_Abbakumov
@Vadim_Abbakumov 3 жыл бұрын
@@user-ee9vd7jj2w Гуглите запрос Student test for nonnormal distribution. Или Robustness of t-test
@user-ns3gp1vp2v
@user-ns3gp1vp2v 2 жыл бұрын
Статистические критерии в Excel на arhiuch.ru
Лекция 7. A/B тестирование. Тест для пропорций
20:09
Лекция 8. Линейная регрессия
1:10:53
Computer Science Center
Рет қаралды 49 М.
КАРМАНЧИК 2 СЕЗОН 5 СЕРИЯ
27:21
Inter Production
Рет қаралды 584 М.
Проверка гипотез. Теория вероятностей
8:29
Анализ данных
Рет қаралды 3,4 М.
Самый быстрый способ стать аналитиком данных
17:17
Ярослав Колупаев
Рет қаралды 36 М.
Коварный t критерий Стьюдента
6:02
Елена Коссова
Рет қаралды 20 М.
Твоя ПЕРВАЯ НЕЙРОСЕТЬ на Python с нуля! | За 10 минут :3
18:31
Хауди Хо™ - Просто о мире IT!
Рет қаралды 225 М.
КАРМАНЧИК 2 СЕЗОН 5 СЕРИЯ
27:21
Inter Production
Рет қаралды 584 М.