🔥🔥Academia Online: codificandobits.com 🔥🔥 🔥🔥Asesorías y formación personalizada: codificandobits.com/servicios 🔥🔥
@rjesmirАй бұрын
Muchas gracias Profesor por excelente explicación, sobre todo al aclarar cuando faltan datos con un 10%. Desde ya esperando la próxima Clase 🎉
@HPCC203 жыл бұрын
Definitivamente un video sobre relleno de datos en series de tiempo sería de gran ayuda. Gracias por toda la información en sus videos. Éxitos.
@pablov10Ай бұрын
Excelente video!
@johanrodriguez2413 жыл бұрын
Buenismo. Como siempre, gran trabajo y me leiste la mente con lo de series de tiempo. Algunas cosas que comentar que pueden ser de alguna ayuda. 1. No hay tecnicas universales para estos casos sino ciertas guías que la experiencia nos mostrará con el tiempo cuando funciona una a estrategia a otra. 2. El tema de imputación usando media o mediana depende mucho de la distribución de los datos. Si se perciben outliers(otro tema para decir que es y que no) en general se recomienda irse por la mediana. Para el caso de variables categoricas se tiende a usar la clase mayoritaria, pero como se comenta "es un tema a tomar con pinzas". 3. Estrategias alternas que pueden ser de ayuda son: - agregar una variable binaria que haga de indicador sobre si una fila tiene o no valores faltantes. - Agregar por cada variable con valores faltantes una columna con el mismo flag por fila. - Agregar una variable que indique el ratio o proporción de datos faltantes en una fila o bien cosas como (sin NA / total) o (NA/ sin NA) teniendo una idea sobre la "calidad de la info en una fila" y agregando esto al modelo que se haga.
@codificandobits3 жыл бұрын
Excelente aporte Johan, gracias por complementar lo mencionado en el video con esos trucos mencionados en (3). Y totalmente de acuerdo con lo que mencionas en (1): experiencia, experiencia y experiencia. Un saludo!
@juakonap3 жыл бұрын
Profesor: Muchas gracias por su contenido. Respecto a este contenido, es importante hace algunas precisiones: 1. No siempre hay que realizar imputación o eliminación de datos faltantes, pues ese dato faltante también puede representar información clave. 2. Todo medio de interpolación para imputación de valores debe considerar el espacio muestral subyacente, es decir tener cuidado con la imputación de valores "fuera de muestra". Saludos!
@codificandobits3 жыл бұрын
Totalmente de acuerdo Joaquín, muchas gracias por tu aporte y un saludo!
@alejandratorres38573 жыл бұрын
Muchas gracias por la información. Acabo de dar con su canal y ya voy por mi tercer video, desde mi perspectiva, su canal es uno de los más enriquecedores en estos temas, muy didáctico y completo, muchas felicidades !!
@codificandobits3 жыл бұрын
Me motiva mucho ver estos comentarios Alejandra. Bienvenida al canal y un saludo!
@feliperuiz4063 Жыл бұрын
Una joya este canal :)
@juanandresnp3 жыл бұрын
Muchas gracias, logras explicar de una forma sencilla y practica, uno de los grandes problemas que se encuentran habitualmente, un Saludo
@codificandobits3 жыл бұрын
:) :) gracias por tu comentario Juan Andrés. Un saludo!
@carlosjuniorchuquillanquih7591 Жыл бұрын
Muy buen video profesor, tengo una duda, llevo trabajando con un dataset sobre atenciones oncológicas, sin embargo, embargo hay una variable que es fecha de atención en el cual hay muchos datos faltantes, no se si sería recomendable aplicar alguna de las técnicas que menciono o solo eliminar esa columnar ya que no es relevante para el modelo de machine learning, muchas gracias profe.
@diegonovaarevalo83093 жыл бұрын
Un excelente insumo, gracias por compartirlo!
@alejandroalvarez54038 ай бұрын
Excelente. Consulta... el link a la guia donde se encuentra? Gracias
@mariafernandaprietovargas19302 жыл бұрын
Hola, excelente tu canal una prgunta cuando tengo informacion faltante de variables categoricas que nos son numerica puedo aplicar alguno de estos modelos?
@rubenquispe295217 сағат бұрын
La imputacion de Algoritmo MICE es un metodo extacto. La cuestion es que hay que saber manejar, por ejemplo en el video a la vista se ve que los datos no van a una disribucion normal por eso salio el valor 0,999 que no es dato real. Por tanto habra que tranformar los datos y luego recien aplicar el metodo.
@sjara912 жыл бұрын
Muchas gracias por tu contenido! me ha ayudado muchísimo. Un gran saludo!
@codificandobits2 жыл бұрын
Gracias por tu comentario Sebastián. Si te interesa profundizar en este u otros temas quedo atento a tus sugerencias. Un saludo!
@davidalejandrogarciamoncad55663 жыл бұрын
Me hiciste recordar la prueba de Little para comprobar que los datos estén MCAR...
@naylamp_gaming Жыл бұрын
Que buena explicacion
@Bondobonco3 жыл бұрын
Gracias por el video muy bueno! Favor incluir Series de tiempo!!
@codificandobits3 жыл бұрын
Hola! Tomo nota de tu sugerencia. Un saludo!
@fernandomendoza7563 жыл бұрын
Gracias por la información
@nicoux95813 жыл бұрын
Impresionante 👌 👏😁
@zzzgerardo3 жыл бұрын
Miguel muy bueno el video, yo llego hasta un analisis de correlacion con alguna otra variable para poder calcular la media del grupo al cual pertenezca, como una agrupacion K pero artesanal.
@codificandobits3 жыл бұрын
Y no has probado con k-vecinos directamente?
@sergiotiria34433 жыл бұрын
Excelente Video
@juanfernando69623 жыл бұрын
Excelente video, muchas gracias!!
@codificandobits3 жыл бұрын
Gracias por tu comentario Juan Fernando. Saludos!
@machine_learning3 жыл бұрын
Deberias por favor sacar un curso
@codificandobits3 жыл бұрын
Sí Anthony, desde el 10 de julio vienen los cursos. Un saludo!
@ebersolorzano6448 Жыл бұрын
Excelente 👍
@edwardrain473 жыл бұрын
He intentado hacer relleno de datos en series de tiempo con redes recurrentes, pero el problema es la cantidad de datos nulos consecutivos, para ese caso las predicciones las realiza muy mal
@juanmanuelcirotorres61553 жыл бұрын
Gracias profesor, genial como siempre
@rockophill39342 жыл бұрын
MAESTRO!!!
@vegamuni2 жыл бұрын
9:45. un autoencoder entrenado con los registros completos imputará los datos faltantes.