K.I.S.S. Pandas больше не нужен? Продвинутые возможности Clickhouse

  Рет қаралды 594

OTUS Онлайн - образование

OTUS Онлайн - образование

6 ай бұрын

На занятии вы:
- Узнаете о крутых и, главное, полезных функциях Clickhouse;
- Сравните устоявшиеся решения в области обработки данных с реализациями в рассматриваемой БД;
- Получите практические знания, материалы и инструкции для дальнейшего изучения и углубления в тему.
Этот урок подходит:
- Инженерам, аналитикам данных, DevOps-специалистам и всем неравнодушным к сфере Big Data;
- Тимлидам, которые ищут ищущим достойные решения для внедрения в собственных командах;
- Тем, кто знаком с Clickhouse и хочет получить полезные практические знания.
«ClickHouse для инженеров и архитекторов БД» - otus.pw/ZATY/
Преподаватель: Алексей Железной - Data Engineer
Подключайтесь к обсуждению в чате - otus.pw/tHVM/
Пройдите опрос по итогам мероприятия - otus.pw/W545/
Следите за новостями проекта:
- Telegram: t.me/Otusjava
- ВКонтакте: otus.pw/850t
- LinkedIn: otus.pw/yQwQ/
- Хабр: otus.pw/S0nM/

Пікірлер: 2
@mgarkunov
@mgarkunov 5 ай бұрын
Pandas - нужный и полезный инструмент и ClickHouse его не заменит. Да, у Pandas есть проблемы с большими датасетами, так как он старается загружать все в память, но в целом уже есть решение похожее на Pandas. При работе с базой данных мы решаем эту проблеме. А реальная проблема в данном открытом уроке не в Pandas и/или ClickHouse, а в методологии построения аналитической платформы. В подавляющем большинстве между базой данных и Pandas есть большое растояние, поэтому загрузка данных на ПК аналитика требудет больших временных ресурсов. И особенно если работа идет по WiFi. Если же Jupyter / Python будут работать рядом с СУБД на другом сервере, то в этом случае проблем с переброской данных не будет. Тот же Airflow обычно крутится на сервере рядом с СУБД и между этими серверами чаще всего канал 1 ГБит/с и выше. Итого: Нужно не таскать данные по сетям, а переместить процесс работы с ними ближе к данным.
@polosatymg
@polosatymg 6 ай бұрын
Начало 13:22
Особенности индексов в колоночных БД на примере ClickHouse
1:08:20
OTUS Онлайн - образование
Рет қаралды 390
ELE QUEBROU A TAÇA DE FUTEBOL
00:45
Matheus Kriwat
Рет қаралды 35 МЛН
«GigaChat: наш опыт обучения LLM»
41:43
Yandex for ML
Рет қаралды 2,8 М.
Знакомство с Apache Kafka // Демо-занятие курса «Apache Kafka»
1:39:46
OTUS Онлайн - образование
Рет қаралды 3,4 М.
Каталоги /proc, /sys и /dev // Демо-занятие курса «Administrator Linux. Professional»
1:24:30
Фоновая работа в Android: Service и WorkManager // Курс «Android Developer. Professional»
1:41:26
Знакомство с Greenplum // Демо-занятие курса «Data Engineer»‎
1:35:37
OTUS Онлайн - образование
Рет қаралды 9 М.
Что такое CLICKHOUSE и колоночные СУБД
14:47
ELE QUEBROU A TAÇA DE FUTEBOL
00:45
Matheus Kriwat
Рет қаралды 35 МЛН