Рет қаралды 661
Apache Spark - самый популярный инструмент мира Big Data. Он позволяет обрабатывать большие объемы данных в распределенном режиме. При помощи него удобно создавать витрины данных, подключаясь к различным источникам: Kafka, Elasticsearch, Cassandra, а также создавать real-time приложения, позволяющие на лету пересчитывать и готовить свежие матрицы признаков для моделей машинного обучения, чтобы поддерживать их в актуальном состоянии.
Узнать подробнее о курсе и записаться: newprolab.com/ru/spark-de/