Apache Spark - Capítulo 1. ¿Qué es Apache Spark?

  Рет қаралды 11,662

Data Engineering Latam

Data Engineering Latam

Күн бұрын

Ponente: Daniel Portugal Revilla
LinkedIn: / daniel-portugal
Capítulo 1. ¿Qué es Apache Spark?
Apache Spark es un motor informático unificado y un conjunto de librerías para el procesamiento de datos en paralelo en clústeres de computadoras. En el momento de escribir este artículo, Spark es el motor de código abierto más desarrollado para esta tarea, lo que lo convierte en una herramienta estándar para cualquier desarrollador o científico de datos interesado en big data. Spark admite múltiples lenguajes de programación ampliamente utilizados (Python, Java, Scala y R), incluye bibliotecas para diversas tareas que van desde SQL hasta streaming y machine learningo, y se ejecuta en cualquier lugar, desde una computadora portátil hasta un clúster de miles de servidores.
Acerca del libro
Título: Spark: The Definitive Guide
Apache Spark es actualmente uno de los sistemas más populares para el procesamiento de datos a gran escala, con API en múltiples lenguajes de programación y una gran cantidad de bibliotecas integradas y de terceros. Aunque el proyecto ha existido durante varios años, primero como un proyecto de investigación que comenzó en UC Berkeley en 2009, luego en la Apache Software Foundation desde 2013, la comunidad de código abierto continúa creando API más potentes y bibliotecas de alto nivel sobre Spark, por lo que todavía hay mucho que escribir sobre el proyecto.
---------------------------------------------------------------------------------------------------------------------
¿Te gustaría compartir y aprender sobre SQL, Bases de datos, Big Data, Cloud, R, Oracle, SQL Server, Hadoop, Hive, Spark, Databricks, Delta Lake, git, Airflow, Apache Hudi, Apache Beam, DVC, lakeFS, Flink, AWS, GCP, Azure, Presto/Trino, Snowflake, Ingeniería de Datos, Machine Learning, MLOps, Data Management, etc con más entusiastas por los datos así como tú?
📣Únete a la comunidad Data Engineering LATAM en las distintas redes que tenemos
bit.ly/DataEng...
📺 KZbin: www.youtube.co...
📈 Linkedin: / data-engineering-latam
📸 Instagram: / dataengineeringlatam
👍 Facebook: / dataengineeringlatam
🐦 Twitter: / dataengilatam
✉ Telegram: t.me/dataengin...
📚 Slack: lnkd.in/eV7hgF3
Grupos de Estudios:
🎤 English Speaking and stuff
🎤 DAMA's Study Group (Data Management)
🎤 Databricks Certified Associate
🎤 Apache Airflow Study Club
🎤 Power BI como debe ser
🎤 Club de Lectura / Designing data-intensive Applications 🐗
🎤¿Quieres dar charla en la comunidad?
docs.google.co....
💌Suscríbete a este canal con el botón rojo que está debajo de los videos y pulsa la campana para que te notifique de las novedades.
📢 ¡Pasa la voz y ayúdanos a ser la comunidad más grande y chévere de todas!

Пікірлер: 15
@federicohi8401
@federicohi8401 2 жыл бұрын
puedes poner la URL para descargar la notebook con los ejemplos de databricks. Gracias
@chemacobain
@chemacobain Жыл бұрын
Como dijera Auronplay: Epetacular!
@carlcaravantsz1869
@carlcaravantsz1869 2 жыл бұрын
Tienen los Notebooks de este curso?
@aldoaguirre9864
@aldoaguirre9864 2 жыл бұрын
Espectacular!!
@DataEngineeringLatam
@DataEngineeringLatam 2 жыл бұрын
Muchas gracias!
@DataEngineeringLatam
@DataEngineeringLatam 2 жыл бұрын
No se olviden de seguirnos en: ✉ Telegram: lnkd.in/e7mx572 📸 Instagram: instagram.com/dataenginee 🐦 Twitter: twitter.com/DataEngiLATAM 👍 Facebook: facebook.com/dataengineer 📚 Slack: lnkd.in/eV7hgF3
@alfonsoperez5914
@alfonsoperez5914 2 жыл бұрын
Excelente aporte!
@DataEngineeringLatam
@DataEngineeringLatam 2 жыл бұрын
No se olviden de seguirnos en: ✉ Telegram: lnkd.in/e7mx572 📸 Instagram: instagram.com/dataenginee 🐦 Twitter: twitter.com/DataEngiLATAM 👍 Facebook: facebook.com/dataengineer 📚 Slack: lnkd.in/eV7hgF3
@ingenieriacuriosidades7293
@ingenieriacuriosidades7293 2 жыл бұрын
Podrían poner la URL del repositores dónde se pueden descargar los notebooks?, por favor
@DataEngineeringLatam
@DataEngineeringLatam 2 жыл бұрын
Puedes acceder al repositorio aquí: github.com/DataEngineering-LATAM/Spark-StudyClub/tree/main/Spark%20-%20The%20Definite%20Guide
@eliseofernandelpachas2776
@eliseofernandelpachas2776 2 жыл бұрын
excelente
@DataEngineeringLatam
@DataEngineeringLatam 2 жыл бұрын
Gracias! 😊
@DataEngineeringLatam
@DataEngineeringLatam 2 жыл бұрын
No se olviden de seguirnos en: ✉ Telegram: lnkd.in/e7mx572 📸 Instagram: instagram.com/dataenginee 🐦 Twitter: twitter.com/DataEngiLATAM 👍 Facebook: facebook.com/dataengineer 📚 Slack: lnkd.in/eV7hgF3
@Notak095
@Notak095 3 ай бұрын
FANTASTICO 2024 ¡¡
@IrvinLC
@IrvinLC 2 жыл бұрын
Hola de donde podemos descargar estos Notebooks?
Apache Spark - Capítulo 2. Una Suave Introducción a Spark
46:12
Data Engineering Latam
Рет қаралды 2,9 М.
Master Databricks and Apache Spark Step by Step: Lesson 1 - Introduction
32:23
Worst flight ever
00:55
Adam W
Рет қаралды 30 МЛН
Стойкость Фёдора поразила всех!
00:58
МИНУС БАЛЛ
Рет қаралды 4,9 МЛН
How do Cats Eat Watermelon? 🍉
00:21
One More
Рет қаралды 11 МЛН
PySpark Tutorial for Beginners
48:12
coder2j
Рет қаралды 84 М.
What exactly is Apache Spark? | Big Data Tools
4:37
nullQueries
Рет қаралды 131 М.
Airflow for Beginners: Build Amazon books ETL Job in 10 mins
13:13
Sunjana in Data
Рет қаралды 6 М.
Data Science desde 0: Analítica de datos Big Data con Apache Spark
28:21
NullSafe Architect
Рет қаралды 56 М.
What Is Apache Spark?
2:39
IBM Technology
Рет қаралды 156 М.
PySpark Tutorial
1:49:02
freeCodeCamp.org
Рет қаралды 1,2 МЛН
How to install PySpark on Ubuntu with Java, Spark and Python?
10:34
Blismos Academy
Рет қаралды 10 М.
Apache Spark Executor Tuning | Executor Cores & Memory
44:35
Afaque Ahmad
Рет қаралды 11 М.
DataScience con PySpark I: Apache Spark, Python, DataFrames y RDDs
32:13
NullSafe Architect
Рет қаралды 46 М.