Building Real Time BI Systems with Kafka, Spark & Kudu: Spark Summit East talk by Ruhollah Farchtchi

Apache Kudu and Spark SQL for Fast Analytics on Fast Data (Mike Percy)

Building Realtime Data Pipelines with Kafka Connect & Spark Streaming by Ewen Cheslack-Postava

Смузи челлендж выбирай Лево или Право

ҚАДІР ТҮНІ БЕЛГІЛЕРІ | Нұрлан имам | #қадіртүні

Устроился на работу в БАНЮ, а тут призраки какие-то..

КОНЦЕРТЫ: 2 сезон | 1 выпуск | Камызяки

Building Real Time BI Systems with Kafka, Spark & Kudu: Spark Summit East talk by Ruhollah Farchtchi

Рет қаралды 13,915

Spark Summit

Spark Summit

Күн бұрын

One of the key challenges in working with real-time and streaming data is that the data format for capturing data is not necessarily the optimal format for ad hoc analytic queries. For example, Avro is a convenient and popular serialization service that is great for initially bringing data into HDFS. Avro has native integration with Flume and other tools that make it a good choice for landing data in Hadoop. But columnar file formats, such as Parquet and ORC, are much better optimized for ad hoc queries that aggregate over large number of similar rows.

Пікірлер

Apache Kudu and Spark SQL for Fast Analytics on Fast Data (Mike Percy)

28:54

Apache Kudu and Spark SQL for Fast Analytics on Fast Data (Mike Percy)

Spark Summit

Рет қаралды 18 М.

Building Realtime Data Pipelines with Kafka Connect & Spark Streaming by Ewen Cheslack-Postava

31:37

Building Realtime Data Pipelines with Kafka Connect & Spark Streaming by Ewen Cheslack-Postava

Spark Summit

Рет қаралды 12 М.

Смузи челлендж выбирай Лево или Право

0:42

Смузи челлендж выбирай Лево или Право

clab_33

Рет қаралды 4,1 МЛН

ҚАДІР ТҮНІ БЕЛГІЛЕРІ | Нұрлан имам | #қадіртүні

38:33

ҚАДІР ТҮНІ БЕЛГІЛЕРІ | Нұрлан имам | #қадіртүні

Talim TV online

Рет қаралды 321 М.

Устроился на работу в БАНЮ, а тут призраки какие-то..

1:2:39

Устроился на работу в БАНЮ, а тут призраки какие-то..

TheBrianMaps

Рет қаралды 3,1 МЛН

КОНЦЕРТЫ: 2 сезон | 1 выпуск | Камызяки

46:36

КОНЦЕРТЫ: 2 сезон | 1 выпуск | Камызяки

ТНТ Смотри еще!

Рет қаралды 3,7 МЛН

Lessons Learned from Dockerizing Spark Workloads: Spark Summit East talk by Tom Phelan

30:33

Lessons Learned from Dockerizing Spark Workloads: Spark Summit East talk by Tom Phelan

Spark Summit

Рет қаралды 4 М.

Spark + Parquet In Depth: Spark Summit East talk by: Emily Curtin and Robbie Strickland

29:50

Spark + Parquet In Depth: Spark Summit East talk by: Emily Curtin and Robbie Strickland

Spark Summit

Рет қаралды 70 М.

Building a Dataset Search Engine with Spark & Elasticsearch: talk by Oscar Castañeda-Villagrán

30:13

Building a Dataset Search Engine with Spark & Elasticsearch: talk by Oscar Castañeda-Villagrán

Spark Summit

Рет қаралды 11 М.

Apache Spark Meet Up at Spark Summit East 2017

1:35:47

Apache Spark Meet Up at Spark Summit East 2017

Spark Summit

Рет қаралды 4,5 М.

Get Rid of Traditional ETL, Move to Spark! (Bas Geerdink)

32:18

Get Rid of Traditional ETL, Move to Spark! (Bas Geerdink)

Spark Summit

Рет қаралды 96 М.

Utilizing Spark as the Analytical Core to an Open Source HTAP Relational Database: John Leach

25:21

Utilizing Spark as the Analytical Core to an Open Source HTAP Relational Database: John Leach

Spark Summit

Рет қаралды 1,6 М.

Using Spark and Riak for IoT Apps-Patterns and Anti Patterns: Spark Summit East talk by Pavel Hardak

35:20

Using Spark and Riak for IoT Apps-Patterns and Anti Patterns: Spark Summit East talk by Pavel Hardak

Spark Summit

Рет қаралды 2,2 М.

Apache Carbondata: An Indexed Columnar File Format for Interactive Query by Jacky Li/Jihong Ma

30:13

Apache Carbondata: An Indexed Columnar File Format for Interactive Query by Jacky Li/Jihong Ma

Spark Summit

Рет қаралды 4 М.

Netflix Productionizing Spark On Yarn For ETL At Petabyte Scale

30:21

Netflix Productionizing Spark On Yarn For ETL At Petabyte Scale

Spark Summit

Рет қаралды 12 М.

ETL Is Dead, Long Live Streams: real-time streams w/ Apache Kafka

39:01

ETL Is Dead, Long Live Streams: real-time streams w/ Apache Kafka

InfoQ

Рет қаралды 277 М.

Смузи челлендж выбирай Лево или Право

0:42

Смузи челлендж выбирай Лево или Право

clab_33

Рет қаралды 4,1 МЛН