ВВЕДЕНИЕ В PYSPARK И SPARKSQL / ОЛЕГ АГАПОВ

  Рет қаралды 28,480

DataLearn

DataLearn

Күн бұрын

Пікірлер: 55
@ManticoreRoko
@ManticoreRoko Жыл бұрын
Великолепный материал для тех кто только начинает погружаться в PySpark. Благодарности ведущему и основателям канала
@illiakaltovich
@illiakaltovich 2 жыл бұрын
Отличная вводная лекция по Spark 🙂 Таймкоды: 1:38 - План вебинара 3:05 - Для кого этот вебинар 3:48 - О спикере 5:00 - Начало. Пример задачи, под которую заточен Spark 11:59 - Что такое Spark? 17:36 - Модель распределенных вычислений в Spark 22:40 - Нужен ли Spark’y Hadoop? 22:25 - Практика. Установка Spark локально 27:04 - Установка Pyspark из pip 35:15 - Запуск Spark из Docker 38:26 - Запуск Spark в Google Colab 45:35 - Обзор собранной статистики о слушателях 46:00 - Q&A сессия 51:08 - Про режимы работы Spark 54:02 - Что можно делать в PySpark? 56:24 - Компоненты PySpark приложения 1:05:54 - Подробнее о DataFrame 1:08:41 - Читаем данные в DataFrame 1:15:08 - О трансформации данных 1:17:26 - О записи данных 1:18:54 - SQL в Spark 1:23:26 - Практика. DataFrame API 2:24:39 - DataFrame API: основные методы в использовании 2:25:36 - SQL functions: основные методы в использовании 2:27:40 - Общие принципы Spark приложения 2:34:08 - Q&A сессия
@annicioua
@annicioua Жыл бұрын
Спасибо тебе добрый человек =)
@olegzaba4756
@olegzaba4756 3 жыл бұрын
вообще классно всё объяснил - 3 часа как одно мгновение ... очень жду продолжение!
@АлександрДергилёв-п8х
@АлександрДергилёв-п8х 3 жыл бұрын
Сильный спикер, спасибо!
@Юрий-б2ф4з
@Юрий-б2ф4з 2 жыл бұрын
Лучшая вводная лекция, которую я видел. Но, ребята, что за звук? 2021й год и треск микрофона?! Вы серьезно?)
@254598
@254598 2 жыл бұрын
Ребята вы лучшие! Купила курс на gb, в итоге модуль про спарк изучаю по вашему видео)
@sergeystrikanov2302
@sergeystrikanov2302 2 жыл бұрын
Большое спасибо! Очень круто для понимания и знакомства с PySpark.
@АндрейКадетов-н3р
@АндрейКадетов-н3р 2 ай бұрын
Прекрасная лекция, спасибо огромное!
@datalearn4398
@datalearn4398 Ай бұрын
Переношу все видео в Rutube, тоже канал Data Learn.
@ДмитрийВолишевский
@ДмитрийВолишевский Жыл бұрын
Кайфовый вэбик. Вы как всегда на уровне бог. Спасибо Олегу!
@lex83641
@lex83641 2 жыл бұрын
Отличный доклад! Гораздо лучше всяких индусов
@bbbkkk930
@bbbkkk930 Жыл бұрын
хороший эфир ... авторам спасибо
@anastasiyaivanova6992
@anastasiyaivanova6992 3 жыл бұрын
Спасибо, очень полезная информация для ознакомления с PySpark. Как раз то что было нужно.
@НикитаКульков-м5ф
@НикитаКульков-м5ф 3 жыл бұрын
Спасибо, долго искал что-то подобное на ру-ресусрах)
@vandriichuk
@vandriichuk 3 жыл бұрын
Спасибо. Для меня очень полезный материал. Особенно ценно, что на русском.
@gpankov
@gpankov 10 ай бұрын
лучшее объяснение!
@lerosh7894
@lerosh7894 Жыл бұрын
вебинар огонь
@denisbaranoff
@denisbaranoff 2 жыл бұрын
Прекрасно, это прям ну очень просится па мастеркласс по пайспар в какой- нибудб юдеми👍👍👍
@Vanzer77
@Vanzer77 3 жыл бұрын
Отличное видео для начала работы с PySpark! Есть вопрос по части, где нужно посчитать статистики по полю manufacturer_name. Из моего опыта с СУБД и Pandas, очень плохой тон делать группировки по текстовым полям - они работают значительно медленнее чем по целочисленным полям / датам. Понимаю, что в видео поле manufacturer_name было выбрано для примера, но как в целом у спарка обстоят дела с группировкой по тестовым колонкам?
@igorbulenko6335
@igorbulenko6335 2 жыл бұрын
Спасибо, очень круто, хотелось бы продолжения ))
@petrodyak
@petrodyak 2 жыл бұрын
Thanks for the introduction to the PySpark! It was very useful.
@aliaksandrsiamenau9922
@aliaksandrsiamenau9922 2 жыл бұрын
Замечательный стрим, спасибо
@faizalimuhammadzoda4731
@faizalimuhammadzoda4731 2 жыл бұрын
Спасибо за хороший контент.
@itrunner
@itrunner 3 жыл бұрын
Очень крутой доклад!
@nikitakrutikov9697
@nikitakrutikov9697 2 жыл бұрын
Респектище, помогло очень
@maksimkuznetsov2132
@maksimkuznetsov2132 Жыл бұрын
Спасибо большое! По ETL вообще мало чего есть в русскоязычном сегменте ютуба. На мой взгляд лучший способ передачи опыта - видео. Питон немного изучал. Сейчас я PL/SQL разработчик, но думаю смещаться в ETL. Дико привык к SQL. И все эти методы кажатся извращением. Вообще БД-шные спецы плюются на спарк и ORM
@529aff
@529aff 9 ай бұрын
в spark можно писать и на sql
@salivona
@salivona 2 жыл бұрын
Очень здорово, спасибо!
@qweras79
@qweras79 Жыл бұрын
Привет. Спасибо большое за видео. Можно вопрос, будь ласка? я попробовала работать в сессии Спарка прямо из Визуал Студио Код - єто очень неудобно по ряду причин. Установила взяла отдельно Юпитер. но сессия Спарка в Юпитера не запускается. Єто невозможно или я что-то делаю не так?
@Asylum_M
@Asylum_M 3 жыл бұрын
Спасибо, а когда продолжение? На ютубе одни вводные лекции для pyspark, а хотелось бы более глубокого погружения.
@maksimkuznetsov2132
@maksimkuznetsov2132 10 ай бұрын
Привет. Кстати, как успехи с пайспарком? Вообще мне показалось, что всего, что тут есть хватит для старта карьеры в этом стэке. Сейчас пытаюсь стартовать в этом имея за плечами большой опыт на SQL и материал этого видео. ))
@Александр-ъ3о1щ
@Александр-ъ3о1щ 27 күн бұрын
+
@ДмитрийАверьянов-щ4г
@ДмитрийАверьянов-щ4г 2 жыл бұрын
Шикарно
@dmitryanoshin8004
@dmitryanoshin8004 3 жыл бұрын
Очень круто! Добавим к модулю 7 DE-101!
@anton108
@anton108 3 жыл бұрын
ты забыл вставить ссылку в GIT
@maksimsvirskiy6828
@maksimsvirskiy6828 3 жыл бұрын
Огромное спасибо - было очень понятно! а где посмотреть презентацию и ссылки все на гит и т.д.?!
@Frezer911
@Frezer911 Жыл бұрын
В чатике трансляции
@maksimkuznetsov2132
@maksimkuznetsov2132 Жыл бұрын
Интересно было бы ещё узнать, где чаще всего бывают затыки по производительнсти.
@annicioua
@annicioua Жыл бұрын
Как жаль, что ведущий вебинара не рассказал, что просто так ты не заинсталлишь Spark через pip install , если не создашь специальные системные переменные среды, а у лектора всё уже готовенько, а у него pyspark к моменту записи вебинара уже давно установлен был..
@volodink
@volodink 8 ай бұрын
А ссылку на гитхаб в коменты скиньте пожалуйста😅
@Egor-sm4bl
@Egor-sm4bl 3 жыл бұрын
Хм, а у меня сразу сохранило в одном файле json.... Что-то не так сделал?
@antonboiko788
@antonboiko788 Жыл бұрын
Драйвер не распределяет данные между экзекьюторами, это делает Cluster manager
@imoldpirate
@imoldpirate Жыл бұрын
норм
@cozyfootball
@cozyfootball 11 ай бұрын
Очень много водяных рассуждений ни о чем. Очень много бэ, мэ, эээ. "Я рассказываю так быстро" - ты серьзно?
@529aff
@529aff 9 ай бұрын
запишешь лучше?
Triple kill😹
00:18
GG Animation
Рет қаралды 18 МЛН
Motorbike Smashes Into Porsche! 😱
00:15
Caters Clips
Рет қаралды 23 МЛН
They Chose Kindness Over Abuse in Their Team #shorts
00:20
I migliori trucchetti di Fabiosa
Рет қаралды 12 МЛН
Car Bubble vs Lamborghini
00:33
Stokes Twins
Рет қаралды 40 МЛН
Что такое Apache Airflow - Курсы "Школы Больших Данных" г. Москва
31:50
DATA АНАЛИТИК: навыки, кейсы, поиск работы и AI-тренды
1:10:41
Госпожа аналитик данных - Ия Зотова
Рет қаралды 255
Apache Spark Installation on Anaconda video(PySpark)
17:58
Manoj Kumar
Рет қаралды 13 М.
Recommendation System in PySpark
38:52
Schaly
Рет қаралды 2,4 М.
PySpark Tutorial
1:49:02
freeCodeCamp.org
Рет қаралды 1,3 МЛН
CI/CD - Простым языком на понятном примере
15:29
Артём Шумейко
Рет қаралды 104 М.
Triple kill😹
00:18
GG Animation
Рет қаралды 18 МЛН