Problema básico de Ingenieria de Datos (para Jrs)

  Рет қаралды 13,126

CodinEric

CodinEric

Күн бұрын

Пікірлер: 67
@nicolasrosso3800
@nicolasrosso3800 2 жыл бұрын
Hola Eric, soy nuevo en tu canal. Soy un analista de datos con intención de cambiar a ing. de datos con lo cual tus videos me estan resultando bastante educativos. Estaría bueno si armas algún video (así bien para bobos) en donde muestres como crear un ambiente (así a modo de sandbox) como para probar cosillas e ir adquiriendo cancha. Desde ya, te dejo ese buen like. Abrazo!
@Yayowz3
@Yayowz3 Жыл бұрын
Apoyo la ideaaaa Eric! Nos ayudaria muchisimo!
@brandotcom6942
@brandotcom6942 Жыл бұрын
Analista a ingeniero, cual seria la diferencia a grandes rasgos
@gerardorosales7775
@gerardorosales7775 10 ай бұрын
@@brandotcom6942 un ingeniero de datos prepara los datos (ETL), que pueden provenir de muchas fuentes, para que un analista los presente de manera más amigable y práctica para llegar a conclusiones sobre los mismos.
@GordoCantaPosta
@GordoCantaPosta Жыл бұрын
yo estoy trabajando de data analyst y practico con estos videos pero me pasa que a los meses me olvido de todo, ahora voy a hacer un esfuerzo fuerte para cambiarme a data engineering, ya casi voy 2.5 años de data analyst, supongo que es momento de que me tomen en serio, ya hago muchas cosas con SQL y azure data factory pero en python nada y me olvido
@miguelbriones6255
@miguelbriones6255 2 жыл бұрын
Primero que nada, gracias por compartir y excelente contenido. Me voy a animar a aprender bien Python. He trabajado con bases de datos relacionales por más de 4 años, y siempre he puesto peros a aprender algún lenguaje de programación bien, pero esto si está interesante!!
@razewow
@razewow 2 жыл бұрын
Dale @CodinEri que crack!! Queremos ver más de airflow yo soy de los que sufre con chrontab jajaja!! con docker!! crack!!
@CodinEric
@CodinEric 2 жыл бұрын
Próximamente 🥰
@edwightdelgado2939
@edwightdelgado2939 2 жыл бұрын
Viendo vídeo súper útiles de codinEric. Se me ocurre seguir el cambio de un producto
@EmilianoEmanuelSosa
@EmilianoEmanuelSosa Жыл бұрын
Yo creo que mas alla de las cuestiones de automatizacion, partir de las bases de el procesamiento es lo mejor. Es decir, obviar procesos incesarios como el crontab
@jorgeruiz7146
@jorgeruiz7146 2 жыл бұрын
Me parece que poner de descripción que es una tarea Jr. Puede ser frustrante para muchos, son conceptos y tecnologías que lleva mucho tiempo dominarlas y haber estado en varios proyectos usandolas. Un Sr o experto del área es quien realmente puede más o menos saber como optimizar esto, a lo mucho ayudar al Jr brindándole que pasos seguir para que lo ayude en alguna etapa de este proceso.
@danielmendieta2666
@danielmendieta2666 2 жыл бұрын
Tu comentario me consuela!. Gracias
@AndersonCastillo-f1v
@AndersonCastillo-f1v Жыл бұрын
Y eso, que para la realización de esos proyectos se usan bibliotecas en python, quiero decir, que aparte de aprender lo básico de python, se debe aprender a trabajar con estas bibliotecas lo cual no es fácil, por lo tanto hay que entrar a documentaciones o ver videos para ciertos proyectos personales también que realizamos.
@israeldamian7383
@israeldamian7383 Жыл бұрын
De ser asi entonces CodinEric es un fraude! quiere asustarnos para disminuir la competencia en su campo!
@mariaeugeniaescobar2389
@mariaeugeniaescobar2389 2 жыл бұрын
Hola Eric del presente, gracias por existir :)
@sebaszb4123
@sebaszb4123 2 жыл бұрын
Por favor, Eric. Enseñanos con airflow y con/sin docker compose
@CodinEric
@CodinEric 2 жыл бұрын
Ya viste la serie que tengo?
@Chris-fy7mz
@Chris-fy7mz 2 жыл бұрын
Excelente video, creá mas de estos porfavor!! Saludos desde Colombia 😁👍
@CodinEric
@CodinEric 2 жыл бұрын
Yeay! Acordate de la me gusteada y la compartida ❤
@danielreyes7507
@danielreyes7507 2 жыл бұрын
buenardo! Justo aprendía los fundamentos de AWS para data engineer y que suerte tuve de encontrarme este video y conocer este canal!! Excelente contenido y comentarios!!
@SergioAdonis
@SergioAdonis Жыл бұрын
Puedes ejecutarlo en paralelo con threading.Thread
@davidmolinagarrido2330
@davidmolinagarrido2330 2 жыл бұрын
buenísimo, crack!
@leonidascarranza7893
@leonidascarranza7893 7 ай бұрын
me gusto esa palabra "automagicamente"
@MartinoxxHD
@MartinoxxHD 2 жыл бұрын
Acabo de descubrir tu canal, encontré oro! Ahora a esperar el vídeo con Docker Compose 😉. Un saludo!
@CodinEric
@CodinEric 2 жыл бұрын
Pronto vendra 😌
@indianameregone
@indianameregone 2 жыл бұрын
soy nuevo, pero mucho y estos videos me ayudan mucho
@CodinEric
@CodinEric 2 жыл бұрын
me alegro que te sirvan 🥰
@nanmargudino3073
@nanmargudino3073 Жыл бұрын
buscando q es airflow porq ni idea de q es eso
@AprendeEmprendiendoHoy
@AprendeEmprendiendoHoy Жыл бұрын
Hola Eric recién te descubro, termine un cursito en KZbin de Python y estoy haciendo muchos ejercidos, todos los días. Pero al mirar este video encuentro el camino mucho mas largo de lo que pensaba. si bien logro entender ,mucho del código, entiendo que no se nada.. que camino me sugerís que recorra para obtener mas conocimiento?
@CodinEric
@CodinEric Жыл бұрын
Primero tenés que decidirte hacia donde querés ir. Si no tenes experiencia investiga sobre desarrollo web, front end, back end. El mundo de data. BI, científico de datos, ingeniero de datos. También devops, QA, seguridad. Una vez que tengas en claro que camino te llama búscate rutas de aprendizaje :)
@xmagcx1
@xmagcx1 2 жыл бұрын
con multiprocessing
@erickfana4466
@erickfana4466 5 ай бұрын
Ya soy programador, trabajo de web developer, pero hace un tiempo me viene llamando la atencion este campo de la Ingenieria de Datos. Para nosotros como latinoamericanos, es factible dedicarse a este rol?
@hersanmartin
@hersanmartin 2 жыл бұрын
Se puede ver el código?
@Daviidscovers
@Daviidscovers Жыл бұрын
Se podria incluir multiprocessing de python... que opinas?
@rguez2332
@rguez2332 2 жыл бұрын
Este proceso se podria realizar o agilizar con airbyte?
@iwearbeard
@iwearbeard 2 жыл бұрын
Que haces Eric, todo bien? Cuando decis de hacerlo por ID de usuario te referis a un dynamic task que corra en paralelo cada uno de ellos? Saludos y buen video!!
@CodinEric
@CodinEric 2 жыл бұрын
Existe el concepto de Dynamic Dags, Dynamic Tasks en airflow. Nunca lo hice a nivel task, se me ocurrio mientras grababa y no estoy 100% seguro que la implementación sea feliz pero haciendo un google rápido hay articulos sobre el tema asi que podria ser un interesante video 😏
@iwearbeard
@iwearbeard 2 жыл бұрын
@@CodinEric Exacto, a eso me refería. Desconozco si funciona de la misma manera cuando se le pega a un API, pero por lo menos a nivel de variables de entorno va perfecto. Saludos!
@CodinEric
@CodinEric 2 жыл бұрын
@@iwearbeard Con la API no hay problema, a lo sumo es problema del que la creo que se aguante las 70k request de una pero incluso no es tanto
@pablomoyano7741
@pablomoyano7741 9 ай бұрын
el discord ya no funciona
@CodinEric
@CodinEric 9 ай бұрын
En mi computadora andaba 🫣 El link anda, sino fíjate el último link pero creo que te va a llevar al mismo invite
@alejandroalfaro6344
@alejandroalfaro6344 Жыл бұрын
Pregunta Eric, tenes la continuacion de esto haciendolo con airflow? No la encuentro en tu canal je.
@CodinEric
@CodinEric Жыл бұрын
Creo que no lo hice pero hice muchos otros vídeos con Airflow y cositas lindas :)
@devgabi1525
@devgabi1525 2 жыл бұрын
Hola Vengo a decir: Por favor Eric mostrame como se hace con Airflow y docke compose!!. Gracias , muy buen video. Consulta: cuando decís "paralelizar por usuarios en Airflow", que cantidad correrían al mismo tiempo?
@CodinEric
@CodinEric 2 жыл бұрын
Está en el backlog, pronto vendrá
@facundolahittette9065
@facundolahittette9065 2 жыл бұрын
Codin, podrá ser algún video de Hadoop Hive y Spark?
@CodinEric
@CodinEric 2 жыл бұрын
Hadoop se pide pero no es algo que creo que sea tan interesante como Hive y Spark. Spark lo tengo en el backlog 😏
@raphanicaise
@raphanicaise 5 ай бұрын
Entiendo todo pero no entiendo nada
@glaciarsoylent4859
@glaciarsoylent4859 2 жыл бұрын
Vengo del mundo de Power BI + SQL, haciendo cursos de Data Science con Python donde consumi apis, etc.. tentado y dubitativo sobre entrar a data eng o seguir con data science. No entendí nada del video xD
@danielgarcia-oj9yz
@danielgarcia-oj9yz 2 жыл бұрын
esto es para jr? :(
@CodinEric
@CodinEric 2 жыл бұрын
Seria una buena entrevista técnica aunque le faltaria un poco de sql
@jorgeruiz7146
@jorgeruiz7146 2 жыл бұрын
Me parece que es para Sr. Muchas de estas tecnologías se aprenden en en el mundo profesional, son varios años dominar bien python, consumo de APIs, entender entorno cloud y flujos de trabajo.
@albertusortiz
@albertusortiz 2 жыл бұрын
Pregunta, entiendo que en un principio tomaba 8 horas en terminar este proceso. Pero ahora con esta nueva funcionalidad optimizada toma 1 hora en terminar el proceso. Asumo que el tiempo se reduce con el mismo poder de computo, es correcto?
@CodinEric
@CodinEric 2 жыл бұрын
El secreto está en como se optimiza haciendo el proceso en paralelo
@albertusortiz
@albertusortiz 2 жыл бұрын
@@CodinEric 🤯 Revele esos secretos de magia negra a nosotros los terrenales, gran maestro.
@nico30994
@nico30994 2 жыл бұрын
Gracias por el video. Casi siempre el objetivo de mejora inmediata es: +Paralelización = -Tiempo ? En otro caso real (y mas grande), hay que preocuparse por excederse en la paralelización consumiendo recursos demás ? En este caso, otra forma de paralelizar (sin airflow) puede ser crear un batch de X usuarios por país y a medida que ejecute el ETL y consiga 10 usuarios, con otro .py, ejecute el get_movements() con el batch (buscando que se ejecute varias veces con varios batchs al mismo tiempo y evitando esperar que termine el load para empezar a ejecutar)? o no se vería mejora en ese caso Muchas preguntas para responder gratis? jajaj
@CodinEric
@CodinEric 2 жыл бұрын
Podemos estar semanas hablando de optimización. Está bien escrito el código? Tiene sentido paralelizar o capaz que dandole un poco mas de ram/cpu se arregla y el costo capaz que es minimo contra hacer todo un refactor. Lo que decis de los usuarios es correcto. Hace un tiempo habia hecho una charla de optimización para un etl de mas de 5 mil tareas que debian correr a la vez, tal vez saque un video del tema en un futuro lejano 😅
@pablobandeira5461
@pablobandeira5461 Жыл бұрын
Jajajajajaja
@pw4645
@pw4645 2 жыл бұрын
Buen video pero esto No es para un JR, es para personas que ya tengan conocimientos avanzados y ya con experiencia.
@hassanmuhieddine2049
@hassanmuhieddine2049 2 жыл бұрын
primer comentario...!! XD
@CodinEric
@CodinEric 2 жыл бұрын
segundo (?
@jorgeeg2668
@jorgeeg2668 2 жыл бұрын
La vrd me frustre un poco :( será como motivación para seguir esforzándome
@CodinEric
@CodinEric 2 жыл бұрын
Vos podés :)
@danielguardia5780
@danielguardia5780 4 ай бұрын
Qué tal ego que tienes tío
@CodinEric
@CodinEric 4 ай бұрын
El menos argentino
@albertomillan9761
@albertomillan9761 2 жыл бұрын
Por favor, Eric. Enseñanos con airflow y con/sin docker compose
@xmagcx1
@xmagcx1 2 жыл бұрын
ya hay videos anteriores de airflow
Primer mes trabajando como Ingeniero de Datos
13:28
CodinEric
Рет қаралды 4,4 М.
Beat Ronaldo, Win $1,000,000
22:45
MrBeast
Рет қаралды 142 МЛН
Мясо вегана? 🧐 @Whatthefshow
01:01
История одного вокалиста
Рет қаралды 7 МЛН
Un dia como Ingeniero de datos JR
11:27
CodinEric
Рет қаралды 4,1 М.
Ejercicio real de ETL realtime
19:50
CodinEric
Рет қаралды 8 М.
Contando elefantes con kafka y spark
14:55
CodinEric
Рет қаралды 7 М.
Entrevista técnica Jr de Python
12:16
CodinEric
Рет қаралды 64 М.
Airflow 2.0 Intro a ingenieria de datos
15:22
CodinEric
Рет қаралды 35 М.
Ejemplo de ETL con Spotify y Python
23:55
CodinEric
Рет қаралды 42 М.
How I would learn Data Engineering (if I could start over)
11:21
Intro a Ingenieria de Datos
13:29
CodinEric
Рет қаралды 22 М.
Beat Ronaldo, Win $1,000,000
22:45
MrBeast
Рет қаралды 142 МЛН