Pandas - разбор всех основных возможностей на реальном датасете

  Рет қаралды 98,874

Alexander Ershov

Alexander Ershov

Күн бұрын

🔥 Telegram t.me/ershov_diary
🔥 Индивидуальная программа по обучению data science под вашу цель с моей менторской поддержкой до результата:
ershov.io/dsprogram?...
Тут я рассказываю почему я создал эту программу, для кого она подходит и в чем ее преимущества:
• Video
🔥 Мой Telegram канал о Data science: t.me/ershovds
🔥 Поддержать канал: / @alexanderershov
Ссылка на код:
github.com/ershovio/youtube_t...
📖 Контакты
Instagram: / ershovio
Twitter: / ershovio
Facebook: / ershovio
LinkedIn: / ershovio
GitHub: github.com/ershovio
⏰ Таймкоды:
0:00 Введение
1:17 Создание датафрейма (DataFrame)
3:49 Экспорт датафрейма
4:38 Первичный анализ датафрейма
6:17 Одномерные данные / Series
7:18 Фильтрация по строкам (rows) и столбцам (columns)
14:43 Сортировка данных
16:20 Объединение датафреймов с помощью concat и merge
21:40 Аналитические функции (describe, mean и т.д.)
23:31 Группировка данных с помощью group by
26:12 Подсчет корреляции
26:33 Визуализация данных с помощью функции plot (matplotlib)
28:47 Изменение данных в Series и DataFrame
#ershovds
alexander ershov,александр ершов,pandas,pandas туториал,pandas для анализа данных,анализ данных,пандас,машинное обучение,аналитик данных,аналитик данных с нуля,аналитик данных профессия,pandas с нуля,pandas dataframe,pandas series,pandas series tutorial,pandas merge,pandas join,pandas group by,pandas groupby,python pandas,python pandas tutorial,pandas обучение,визуализация данных и машинное обучение:,визуализация данных,визуализация данных python

Пікірлер: 127
@user-ze1jo3ln5k
@user-ze1jo3ln5k 2 жыл бұрын
Александр, прекрасная работа! Спасибо! Всё понятно и полезно!
@andreychayka4018
@andreychayka4018 2 жыл бұрын
Отлично получилось рассказать об основных моментах четко и сжато. Супер. Еще было бы здорово выложить под видео ссылку на ноутбук с представленным материалом.
@sofiasmith4659
@sofiasmith4659 2 жыл бұрын
Спасибо! Всё очень понятно и наглядно, очень нравится ваш способ просто объяснять!
@user-it2hg6po5z
@user-it2hg6po5z Жыл бұрын
Благодарю Вас, Александр! Очень полезный, понятный курс!
@inthedark122
@inthedark122 2 жыл бұрын
Спасибо за краткую выжимку, довольно полезно для начинающих
@alcomadness
@alcomadness Жыл бұрын
Самое лучшее, что есть про Pandas в российском KZbin. Спасибо вам!
@kirillmelnikov1700
@kirillmelnikov1700 Жыл бұрын
Обалденное видео, просто раскрыли глаза, всё очень понятно, спасибо за ваш труд ! И кстати видос этой либы совместно с NumPy было бы очень полезно))
@faritr9988
@faritr9988 2 жыл бұрын
Отлично прошёлся по базе. Большое спасибо!
@svetlanapopova5012
@svetlanapopova5012 11 ай бұрын
Спасибо огромное! пересмотрела кучу видео но только вы объясняете понятным для не экспертов языком.
@alexkochevnicke5122
@alexkochevnicke5122 2 жыл бұрын
Очень хорошая работа. Всё понятно, интересно и увлекательно. Благодарю. Присоеденюсь к просьбе сделать лекцию по numpy.
@PetrovMaxim3dmarks
@PetrovMaxim3dmarks 2 жыл бұрын
Отличное видео, очень полезно на первых порах. Спасибо!
@user-xs4ly2cw8e
@user-xs4ly2cw8e Жыл бұрын
Очень классно видео, все просто, наглядно и без воды!
@oldzas
@oldzas 2 жыл бұрын
Отличная грамотная речь, приятно слушать
@kssmss1240
@kssmss1240 Жыл бұрын
Спасибо! Лучшее видео по теме библиотеки Pandas!!!!!
@NIKERRUS
@NIKERRUS 2 жыл бұрын
Спасибо, отличный материал! Интересно посмотреть от вас про numpy)
@AlexanderErshov
@AlexanderErshov 2 жыл бұрын
Постараюсь снять)
@sergg2711
@sergg2711 Жыл бұрын
@@AlexanderErshov а что означает такая конструкция df[df['Age'] == (5|1)]?
@user-rn9jx7gt7r
@user-rn9jx7gt7r 2 жыл бұрын
Спасибо) Класс, доходчиво
@user-kw6sb1rt5b
@user-kw6sb1rt5b Жыл бұрын
Оч круто. Нужно еще пару разков прослушать ❤
@MI-fd9es
@MI-fd9es 2 жыл бұрын
Спасибо, отличный урок!
@user-xy7sf6il5w
@user-xy7sf6il5w Жыл бұрын
Отличное видео, все понятно объясняете, спасибо!!!
@user-cw2pt5dd7q
@user-cw2pt5dd7q 2 жыл бұрын
Очень круто! Добавил в закладки
@donfedor007
@donfedor007 2 жыл бұрын
Спасибо ! Хороший ролик!
@user-hk2rk5yh9f
@user-hk2rk5yh9f 2 ай бұрын
Спасибо за видео! очень емко, но все понятно.
@maksbelov2155
@maksbelov2155 2 жыл бұрын
Классное видео, спасибо больше. Очень помогло.
@alexeyishkov2236
@alexeyishkov2236 Жыл бұрын
Спасибо! Очень эффективное повествование!
@user-bw2uc6pw5y
@user-bw2uc6pw5y 4 ай бұрын
Нашел книги по Pandas - Б.Пасхавера, А.Груздева и Хейдта, под 1000 страниц каждая, читал, вникал и вдруг наткнулся на это 35-минутное видео с блокнотами из колаба!!! За 35 минут так охватить тему! Александр, слов нет, здорово! Спасибо!!!!!
@RUSn9
@RUSn9 2 жыл бұрын
Благодарю, отличное видео.
@vladsol-wb7kg
@vladsol-wb7kg Жыл бұрын
Спасибо, очень доходчиво объяснено
@SamirHabib
@SamirHabib 4 ай бұрын
Спасибо большое, очень полезное видео. Многое узнал за полчаса. Привет из Баку!
@sanjarsanjarov4262
@sanjarsanjarov4262 7 ай бұрын
Замечательное видео! Автор благодарю!
@photo_graf_khv
@photo_graf_khv 7 ай бұрын
Отлично подан материал👍
@erasylzhumadilov4359
@erasylzhumadilov4359 2 жыл бұрын
все просто и понятно, спасибо
@user-iv5hw8rm8x
@user-iv5hw8rm8x Ай бұрын
Не человек, а глыба! Уважение автору!
@user-fo2lh9he2e
@user-fo2lh9he2e Жыл бұрын
Видео - топ! Спасибо! Для тех кто знает SQL и хочет Pandas изучить идеально подойдет.
@Go_ny
@Go_ny 18 күн бұрын
Бро, просто имба, выручил
@Alex-yx2ye
@Alex-yx2ye 2 жыл бұрын
Спасибо за инфу и код
@user-ed1hy3by5p
@user-ed1hy3by5p 2 жыл бұрын
Реально лучшее вводное видео по пандасу! Лайк со всех моих гугловских учёток.
@cyberpwn4332
@cyberpwn4332 Жыл бұрын
Очень годный видос для новичков, единственное есть замечание по df.shape и df.columns. Это не функции а параметры объекта, и потом в случае классов и объектов правильнее говорить не функции а методы, хотя суть конечно одна и та же. В любом случае пожелаю вам удачи в развитии канала, с меня лайк и подписка
@user-qy5oz9zd6f
@user-qy5oz9zd6f 7 ай бұрын
Очень содержательно. Только изображение лучше разворачивать на весь экран
@informatikavaxti7512
@informatikavaxti7512 2 ай бұрын
Cпасибо! А как можно изменить ряд колонн на дф или удалить их?
@user-dg1wo8hs7e
@user-dg1wo8hs7e 11 ай бұрын
Мне понравилось лаконичность, и подача. Все понятно. Можно использовать как справочник. Я сейчас прохожу курс по DC, так там на все это ушло три недели. Хотя там практики тоже много. Но видео мне будет в помощь, не раз еще пересмотрю. Автору Респект!
@user-go1cm3bi7g
@user-go1cm3bi7g 7 ай бұрын
Не Яндекс Практикум ли? :)
@ilia_meysak
@ilia_meysak Жыл бұрын
Спасибо!
@lazyknight8106
@lazyknight8106 2 жыл бұрын
А как выводить информацию как у Вас (красивая табличка)? у меня какая-то неструктурированная ерунда на выходе
@gorbatchev41
@gorbatchev41 Жыл бұрын
Александр, как вы скопировали путь к файлу csv в аргумент в начале видео?
@user-dt2ub9no2z
@user-dt2ub9no2z 10 ай бұрын
Скоро зима, скоро зима, пароноя. Этот мчк просто находка тем кто смотрит за горизонт, для меня пока на лету, надо готовиться к зиме. У нас 10 месяцев зимы, остальное все лето.
@user-tz1sf2qr6d
@user-tz1sf2qr6d 2 жыл бұрын
Спасибо!!
@mariascofa
@mariascofa 2 жыл бұрын
спасибо!
@_tiredofidiocy_
@_tiredofidiocy_ Жыл бұрын
Если у меня получится с кикстарта с этого видоса один из своих алгоритмов из Mathcad воплотить на пандах то моей благодарочке не будет предела. Для начала услышал csv, уже хорошо, с этого начинаются все мои алгоритмы)
@Dmitrii-Zhinzhilov
@Dmitrii-Zhinzhilov Жыл бұрын
Благодарю! Я полный новичок в Pandas, перепечатывал код, всё получилось, разобрался, понял. Отличное идеальное изложение! 👍💯🔥 (подписка на канал +1, лайк по умолчанию)
@Dmitrii-Zhinzhilov
@Dmitrii-Zhinzhilov Жыл бұрын
подписка на канал +1, лайк по умолчанию
@kab333
@kab333 2 жыл бұрын
Всем привет. Проблема есть, в общем данные с екселя импортирую в таблицу (oracle), при чтении (read_excel) ошибка выходит UnicodeEncodeError, конкретно ругается на казахскую букву қ. Добавлял параметр encoding='utf-8' в read_excel и with open не помогло. Как это решить, помогите пжл?
@p.4017
@p.4017 Жыл бұрын
Хороший урок! Но вопрос, а как создать новый столбец где будет писаться например возраст от 0-18 дети, 18-35 молодёжь и тд? Просто все я смотрю либо булевые значения, либо вообще никак не говорят, хотя знать интересно)
@photo_graf_khv
@photo_graf_khv 7 ай бұрын
Отличный материал!
@jrdipper9616
@jrdipper9616 4 ай бұрын
хуичный
@rassulkz4486
@rassulkz4486 16 күн бұрын
Александр, программа обучения уже не работает? Спасибо за видео
@user-os4ud5vs5n
@user-os4ud5vs5n 2 жыл бұрын
Круто! Спасибо за видео!
@worldtech2770
@worldtech2770 Жыл бұрын
Спасибо! подскажите пожалуйста, как сделать так что бы в pandas отображались оригинальные числа которые я открыл с файла .csv добавляются лишние 0 и в некоторых столбцах не на том месте точка стоит. Вот оригинал строки: 82; 1; 40.79326147; 354064; 0.1637; 5.12; 5000000000 Вот что показывает pandas: 82 1.000000 40.793261 3.540640e+05 0.16370 1 5.120000 5.000000e+09
@melodic_tech_house
@melodic_tech_house 2 жыл бұрын
Подскажите почему в pysharm гистограмма не отображается в виде картинки¿? Только данные AxesSubplot() может в ps нет такой опции?
@nataliepodgainova6582
@nataliepodgainova6582 2 жыл бұрын
А если в столбце есть имя и фамилия, как можно сделать выборку только по имени? Имя идёт первым
@23fire23
@23fire23 2 жыл бұрын
На 5:50 разве shape и columns это функции?) Это же атрибуты класса)
@AlexanderErshov
@AlexanderErshov 2 жыл бұрын
да, ты прав, неправильно выразился
@miladiter9830
@miladiter9830 2 жыл бұрын
если я знаю всё то что Вы рассказали в этом ролике - мой уровень Пандас можно определить как 1 из 10 или на этом этапе 0? :)
@user-lh6xe3zi1t
@user-lh6xe3zi1t Жыл бұрын
👍👍👍 + подписался!
@user-sg9dd7zz1w
@user-sg9dd7zz1w 8 ай бұрын
вы супер
@user-lh6xe3zi1t
@user-lh6xe3zi1t Жыл бұрын
👍👍👍
@VlasTrunov
@VlasTrunov 2 жыл бұрын
@Alexander Ershov, я вижу, что среди источников есть SQL. А зачем бы я использовал pandas, когда все практически те же функции я могу использовать в самом postgreSQL? Я, кстати, не в курсе, может ли pandas парсить так же, как и pg, строки jsonb. Иными словами, поясни, пожалуйста, когда pandas нужен и когда не нужен. Спасибо за видос.
@AlexanderErshov
@AlexanderErshov 2 жыл бұрын
Pandas позволяет делать в том числе и визуализацию, ну а так - да многое можно сделать и в sql
@Yelemessi16
@Yelemessi16 2 жыл бұрын
Полезное видео, спасибо
@vogor7
@vogor7 2 жыл бұрын
Потрясающий материал! Я прохожу курс онлайн (не у вас), и там половина курса примерно - вот это получасовое видео =) Очень круто, увидел новые фишки (для себя), например обращение по loc и iloc, до этого их не очень понимал. Также понял, что plot - очень простой инструмент в обращении (поначалу по крайней мере). И очень наглядный материал, всё же Титаник - легенда =) НАчинаешь уже сам ковыряться в этом. Спасибо огромное!
@AlexanderErshov
@AlexanderErshov 2 жыл бұрын
Спасибо, у меня если что не онлайн курс, а именно индивидуальная программа с менторской поддержкой
@vogor7
@vogor7 2 жыл бұрын
@@AlexanderErshov , сорри, неточность.
@SP-cd8be
@SP-cd8be 2 жыл бұрын
@@AlexanderErshov поддерживаю человека, во многих моментах это редкий по понятности в ру-сегменте видос по пандас не только в плане объема, но и донесения информации.
@alexanderkoretskiy5260
@alexanderkoretskiy5260 2 жыл бұрын
А что за онлайн курс?
@vogor7
@vogor7 2 жыл бұрын
@@alexanderkoretskiy5260 Udemy, Data Science
@andreyo.945
@andreyo.945 2 жыл бұрын
Большое спасибо!
@user-rh1vi6cd2z
@user-rh1vi6cd2z 2 жыл бұрын
круто
@user-gd9ki4mp4t
@user-gd9ki4mp4t Жыл бұрын
Хотел бы спросить. Если я повторяю Ваши действия в IDLE в интерактивной сессии с открытием файла по Титанику в df, а затем записываю с помощью метода to_csv, то почему-то при открытии с помощью Excel у меня каждая строка (в т. ч. заголовки) записываются в одну клетку первого столбца вместо красивых строк и заголовков. Что может быть не так?
@sagatdk2843
@sagatdk2843 Жыл бұрын
csv файл в exel открывайте через "Данные - получить данные - из текстового файла/csv файла". это нужно сделать в новой таблице
@user-gd9ki4mp4t
@user-gd9ki4mp4t Жыл бұрын
Спасибо, попробую
@Sergiypsm
@Sergiypsm 2 жыл бұрын
А что за браузер такой? Как-то прикольно выглядит юпитер
@kairatalmenov9558
@kairatalmenov9558 11 ай бұрын
ДД. помогите плз, что-то я запнулся в самом начале, не смог прочитать с Excel. пишу так df=pd.read_csv('C://Users/locadm/Desktop/sber.csv') но выходит ошибка. не могу разораться как нужно указывать путь к файлу Excel чтоб его открыть?
@osukewa7687
@osukewa7687 2 ай бұрын
надо слэши поменять на обратные слэши
@markblack9378
@markblack9378 Жыл бұрын
а как он так jupyter настроил, мб вкурсе кто как включить меню слева, а курс реально лучший просто слов нету, как все понятно.
@murasakir1n448
@murasakir1n448 5 ай бұрын
Извините, а эта библиотека нужна для дата инженера или другая? Просто все видео о том, что эта библиотека используется для аналитики и нигде не видел, чтобы говорили о том, что она используется для инженерии данных
@ekaterinapetrik1008
@ekaterinapetrik1008 2 жыл бұрын
Реально, то что надо
@dGDeika
@dGDeika 2 жыл бұрын
very good nice
@RManar7
@RManar7 2 жыл бұрын
То что надо!Лайк) p.s. первый)
@grafist025111
@grafist025111 2 жыл бұрын
пилите ышшо, в рунете слишком мало подобного!
@rumvitrumvit8055
@rumvitrumvit8055 Жыл бұрын
А что это за среда разработки? Кажется удобной.
@user-cd7bk5xn7w
@user-cd7bk5xn7w 9 ай бұрын
вряд ли вопрос ещё актуален, но отвечу для тех, кого заинтересует в комментариях среда разработки называется Jupyter Notebook
@GunaevVO
@GunaevVO 2 жыл бұрын
Народ pandas установлен но выводит ошибку import pandas as pd ModuleNotFoundError: No module named 'pandas' у кого такая же проблемы была? питон стоит версии 3.9
@user-ul3on9fi8b
@user-ul3on9fi8b 2 жыл бұрын
Возможно не на тот Python установлен модуль. pip freeze покажет вам все установленные модули Попробуйте pip3 install pandas
@user-yg8xm6oq5q
@user-yg8xm6oq5q 2 жыл бұрын
Александр Вы на высоте!, может подскажете ( Ваше мнение авторитетно), с помощью какой программы создать активный дашборд? Мы работаем в сфере экологии и нам никто не может объяснить!
@AlexanderErshov
@AlexanderErshov 2 жыл бұрын
Можете посмотреть это www.tableau.com/learn/get-started/dashboards
@A.M.8181
@A.M.8181 2 жыл бұрын
Можно узнать, а почему не power bi?
@MrHeavy-po2or
@MrHeavy-po2or 2 жыл бұрын
спасибо за обзор
@user-zl3rb8rr3t
@user-zl3rb8rr3t 2 жыл бұрын
Шикарно
@user-ex7px3np4y
@user-ex7px3np4y 2 жыл бұрын
Тысяча лайков
@MisterDraiman
@MisterDraiman Жыл бұрын
пользователи Титаника одобряют
@iiavuk631
@iiavuk631 Жыл бұрын
Пожалуйста, прочитайте, что такое функция, чтобы каждую язву функцией не обзывать.
@hinomuratomisaburo4901
@hinomuratomisaburo4901 2 жыл бұрын
Крутой контент ващпе 😃😃😃👍👍👍👍👍👍👍👍👍👍👍👍👍👍
@rz799
@rz799 2 жыл бұрын
как скачивать ноутбук с github? если сохранить по ссылке, то при открытии в JN выдает ошибку.
@AlexanderErshov
@AlexanderErshov 2 жыл бұрын
Клонировать себе весь проект
@rz799
@rz799 2 жыл бұрын
@@AlexanderErshov как это сделать? подскажи пожалуйста, обычный csv даже скачать не получается, точнее открыть потом у себя на компе
@AlexanderErshov
@AlexanderErshov 2 жыл бұрын
@@rz799 git clone github.com/ershovio/youtube_tutorials.git
@vliafto2829
@vliafto2829 11 ай бұрын
Все отлично. Но я бы увеличил масштаб написания кода для слабовидящих людей. То что самое важное - происходит на площади 1 кв. см. самого экрана. Если бы не звук, закрыл бы видос.
@lazyknight8106
@lazyknight8106 2 жыл бұрын
3:20, необязательно, можно не дописывать .from_dict
@spectorone7429
@spectorone7429 2 жыл бұрын
А как в этой же задаче решить следующее: 1)Подсчитать долю выживших среди тех, у кого было несколько кают. 2)Найти выжившую девушку в возрасте от 18 до 25 (включительно) у которой был самый дешевый билет. Никак не могу допереть.
@ingmarvanchikoff7199
@ingmarvanchikoff7199 Жыл бұрын
Забыл, что она должна выжить. Правильно будет так: df[(df['Survived']==1) & (df['Sex']=='female') & ((df['Age']>=18) & (df['Age']
@sviteribuben7245
@sviteribuben7245 2 жыл бұрын
хммм. .notna() удобно. Решал иначе данную фильтрацию.
@user-hd8oy9xp8m
@user-hd8oy9xp8m 2 жыл бұрын
Зачем нужен pandas если есть. Excel?
@AlexanderErshov
@AlexanderErshov 2 жыл бұрын
зачем нужен excel если есть pandas ?)
@user-hd8oy9xp8m
@user-hd8oy9xp8m 2 жыл бұрын
@@AlexanderErshov не знаю, вот хотел узнать
@bolatu8273
@bolatu8273 2 жыл бұрын
Лайфхак: на скорости 1,5 тоже всё понятно :)
@dobroubro
@dobroubro Жыл бұрын
зачем дергается картинка то ? чтобы раздражать ? не буду смотреть сразу
@nickolaytelelichcko7203
@nickolaytelelichcko7203 2 жыл бұрын
В избранное.
@evgeniyagorovaya8075
@evgeniyagorovaya8075 Жыл бұрын
Невозможно слушать… местечковые объяснения, «каннект»… пока-пока
@user-ec8qx6vo9b
@user-ec8qx6vo9b Жыл бұрын
Код не работает. Пишет Error tokenizing data... Expected 1 fields ..... и.т.д
@user-lk1dl3kz6t
@user-lk1dl3kz6t 2 жыл бұрын
Почему df.groupby('Sex')['Age'].plot(kind='kde') и sns.displot(data=df, x='Age', kind='kde', hue='Sex') выдают разные графики?
@mikenerovnya3524
@mikenerovnya3524 2 жыл бұрын
Потому что при отрисовке у них разные стандартные параметры пропускной способности (Погуглите как присваивать вручную и поиграйте со значениями.
@C0n3
@C0n3 Жыл бұрын
"будем мёгджить ", не проше говрить "объеденять"
Разбор реальной data science задачи
38:51
Alexander Ershov
Рет қаралды 188 М.
Backstage 🤫 tutorial #elsarca #tiktok
00:13
Elsa Arca
Рет қаралды 37 МЛН
WHY THROW CHIPS IN THE TRASH?🤪
00:18
JULI_PROETO
Рет қаралды 9 МЛН
Learning Pandas for Data Analysis? Start Here.
22:50
Rob Mulla
Рет қаралды 78 М.
ИНДЕКСЫ В БАЗАХ ДАННЫХ. СОБЕС В OZON.
33:59
Ваня Ио про разработку
Рет қаралды 40 М.
Как стать программистом после курсов?
10:46