Азы работы с pandas.DataFrame на примере задачи о Титанике.

  Рет қаралды 42,809

Kovalevskyi Academy

Kovalevskyi Academy

Күн бұрын

Пікірлер: 45
@ZipOfficial
@ZipOfficial Жыл бұрын
3:04 импорт данных 4:39 удаление idишек 8:55 вывод инфы 10:30 вывести один из столбцов 10:56 подсчёт кол-во записей 12:17 визуализация кол-во данных 13:09 среднее число 13:32 построение гистограммы 17:32 избавление от nan 19:51 узнать корреляцию
@dariaarkhipova5419
@dariaarkhipova5419 4 жыл бұрын
Уже будучи знакомой с анализом данных приятно слушать видео. Очень дельные вещи
@Xapek2008
@Xapek2008 6 жыл бұрын
Интересно и не занудно, даже скорость не надо менять, спасибо
@apozyak
@apozyak 2 жыл бұрын
спасибо, очень понятно и доступно!
@seychasov
@seychasov 4 жыл бұрын
какой же качественный контент! спасибо! лайк подписка
@kotleta7643
@kotleta7643 2 жыл бұрын
Очень здорово, спасибо
@lekkaverhovcev6334
@lekkaverhovcev6334 7 жыл бұрын
Уточню для тех кто смотрит: автор оговорился вот тут (kzbin.info/www/bejne/lXWUqZutjbqYmKsm27s), это целочисленное деление, не остаток.) За видео лайк.) Спасибо)
@egoregoroff104
@egoregoroff104 3 жыл бұрын
Спасибо!
@РоманМомотов-ш9й
@РоманМомотов-ш9й 2 жыл бұрын
спасибо, очень позновательно
@SnowyToly
@SnowyToly 4 жыл бұрын
Очень помогло, огромное спасибо!
@VARYHIN
@VARYHIN 6 жыл бұрын
Огромное спасибо за видео!
@Yayakimenko
@Yayakimenko 4 жыл бұрын
Спасибо большое! Автор молодец!
@Storks40
@Storks40 Жыл бұрын
Кажется в 2023 другой датасет. И не понял как имена столбцов в датасете поменялись на "контсанты, определенные перед считыванием данных. У меня ничего не изменилось.
@ДмитрийШалимов-ч5у
@ДмитрийШалимов-ч5у 3 жыл бұрын
Сленг зашкаливает.
@tetianaprokhorova347
@tetianaprokhorova347 6 жыл бұрын
Вы упоминали, что планируете снимать видео о TensorFlow . Ваши планы изменились? Или видео можно посмотреть на Вашем другом канале?
@vitaliynabiev2530
@vitaliynabiev2530 3 жыл бұрын
Спасибо, хорошее видео
@DAROM-TK
@DAROM-TK 5 жыл бұрын
на 3:30 Вы говорите, что будет выводиться без print. Чего то я это не понял. У меня без принт не выводится.Что я не так делаю?
@ВалерияНовикова-п9з
@ВалерияНовикова-п9з 2 жыл бұрын
Как так научиться(
@andreybelyaev5703
@andreybelyaev5703 4 жыл бұрын
Супер круто!
@ОлегКозырис-л8с
@ОлегКозырис-л8с 4 жыл бұрын
Добрый день! Подскажите, почему у меня файл загрузился не в том виде как у вас? joxi.ru/ZrJ1LZotMVKVkA Колонки и значения совсем другие, возможно исходный файл был изменен. Где взять оригинальный файл из видео для работы?
@kabalchik5085
@kabalchik5085 4 жыл бұрын
++Такая де проблема
@MaxM1
@MaxM1 6 жыл бұрын
Так вот и самый главный вопрос, как комплексно анализировать данные? Как подсчитать вероятность выживания парня 30 лет во втором классе? Методом линейной регрессии с множеством предикторов?
@ВолковАнтон-ь9п
@ВолковАнтон-ь9п 6 жыл бұрын
Бинарное дерево решений
@Gleb615
@Gleb615 6 жыл бұрын
Вячеслав, спасибо за видео. Продолжение будет ?
@MaxM1
@MaxM1 6 жыл бұрын
21:30 возрастная группа 1 - выживших больше
@umidjonsadatov3426
@umidjonsadatov3426 4 жыл бұрын
12:08 это капитан корабля
@VakaramGolang
@VakaramGolang 3 жыл бұрын
у меня некоректно работает .info() ? почему то неверно
@АндрейМакаров-с1й4у
@АндрейМакаров-с1й4у 6 жыл бұрын
Вячеслав, будут ли новые видео?
@MorozowPavlik
@MorozowPavlik 4 жыл бұрын
А продолжение есть?
@ПавелОсокин-ш3г
@ПавелОсокин-ш3г 4 жыл бұрын
Почему то функция map_to_percent выдаёт кривой датафрейм, в таком виде 1 [0.301887, 0.698113] - то есть значения скомканы в массив, сверху названий Survived нет.
@ПавелОсокин-ш3г
@ПавелОсокин-ш3г 4 жыл бұрын
Заработало только так: def map_to_percent(r): return pd.Series([float(v)/sum(r) for v in r])
@AndreyKryajev
@AndreyKryajev 6 жыл бұрын
Спасибо за видео, а можно ноутбук на github скинуть ?
@s78ap
@s78ap 6 жыл бұрын
супер
@aleksanderklimov3172
@aleksanderklimov3172 7 жыл бұрын
Спасибо за видео! Подскажите как правильно сделать fillna по условию? Допустим заменить на медиану возраста для всех у кого Sex = female и Pclass = 1st?
@KovalevskyiAcademy
@KovalevskyiAcademy 7 жыл бұрын
что то типа: df.fillna(value="female")
@reginashavaleeva3832
@reginashavaleeva3832 7 жыл бұрын
Aleksander Klimov I
@costa86
@costa86 Жыл бұрын
@@KovalevskyiAcademy не сработает. Нужно условие что пол определённый и класс определённый. Те заменять наны на медианы определённого класса и пола
@llllpavle
@llllpavle 5 жыл бұрын
лайк
@glepfingerman7731
@glepfingerman7731 7 жыл бұрын
df[AGE_GROUP_COL] = df[AGE_COL].map(lambda age: int(age // 10)) df[:HEAD_ROWS_TO_SHOW] ошибка на этой строчке --------------------------------------------------------------------------- ValueError Traceback (most recent call last) in () ----> 1 df[AGE_GROUP_COL] = df[AGE_COL].map(lambda age: int(age // 10)) 2 df[:HEAD_ROWS_TO_SHOW] /Users/konstantin/anaconda/lib/python2.7/site-packages/pandas/core/series.pyc in map(self, arg, na_action) 2175 new_values = algos.take_1d(arg._values, indexer) 2176 else: -> 2177 new_values = map_f(values, arg) 2178 2179 return self._constructor(new_values, pandas/src/inference.pyx in pandas.lib.map_infer (pandas/lib.c:66124)() in (age) ----> 1 df[AGE_GROUP_COL] = df[AGE_COL].map(lambda age: int(age // 10)) 2 df[:HEAD_ROWS_TO_SHOW] ValueError: cannot convert float NaN to integer
@atlant1707
@atlant1707 6 жыл бұрын
+5
@chernobyl1999
@chernobyl1999 6 жыл бұрын
слово "эпплаит" просто убило...
@javadeveloper-o5j
@javadeveloper-o5j 5 жыл бұрын
Ошибка на df[PCLASS_COL].value_counts() colab.research.google.com/drive/1_ul3DyhQOqlpXymw4k2-vBBE_v0Pls50 В csv файле 32 записи по ссылке ( а не 1313 как в видео) vincentarelbundock.github.io/Rdatasets/csv/datasets/Titanic.csv, и нет PClass столбца, есть Class, и колонка Age не содержит float данных Спасибо за видео, очень доходчиво, по полочкам, все законспектировала, три раза пересмотрела, вот что значит опыт преподавателя - разработчика ! Супер!!! Еще бы про Kaggle сделали видео как участвовать в соревнованиях по Титанику.
@serega9422
@serega9422 4 жыл бұрын
Спасибо за полезное видео!
Что-что Мурсдей говорит? 💭 #симбочка #симба #мурсдей
00:19
coco在求救? #小丑 #天使 #shorts
00:29
好人小丑
Рет қаралды 120 МЛН
Разбор реальной data science задачи
38:51
Alexander Ershov
Рет қаралды 203 М.
Решение задач pandas+numpy из мира Excel
25:49
ITvladranepa
Рет қаралды 1,7 М.
Основы Pandas Python | Series, DataFrame И Анализ Данных
48:10
PyLounge - программирование на Python и всё о IT
Рет қаралды 101 М.