¿Cómo manejar los DATOS FALTANTES?: guía completa

  Рет қаралды 12,762

Codificando Bits

Codificando Bits

Күн бұрын

Пікірлер: 39
@codificandobits
@codificandobits 3 жыл бұрын
🔥🔥Academia Online: codificandobits.com 🔥🔥 🔥🔥Asesorías y formación personalizada: codificandobits.com/servicios 🔥🔥
@rjesmir
@rjesmir Ай бұрын
Muchas gracias Profesor por excelente explicación, sobre todo al aclarar cuando faltan datos con un 10%. Desde ya esperando la próxima Clase 🎉
@HPCC20
@HPCC20 3 жыл бұрын
Definitivamente un video sobre relleno de datos en series de tiempo sería de gran ayuda. Gracias por toda la información en sus videos. Éxitos.
@pablov10
@pablov10 Ай бұрын
Excelente video!
@johanrodriguez241
@johanrodriguez241 3 жыл бұрын
Buenismo. Como siempre, gran trabajo y me leiste la mente con lo de series de tiempo. Algunas cosas que comentar que pueden ser de alguna ayuda. 1. No hay tecnicas universales para estos casos sino ciertas guías que la experiencia nos mostrará con el tiempo cuando funciona una a estrategia a otra. 2. El tema de imputación usando media o mediana depende mucho de la distribución de los datos. Si se perciben outliers(otro tema para decir que es y que no) en general se recomienda irse por la mediana. Para el caso de variables categoricas se tiende a usar la clase mayoritaria, pero como se comenta "es un tema a tomar con pinzas". 3. Estrategias alternas que pueden ser de ayuda son: - agregar una variable binaria que haga de indicador sobre si una fila tiene o no valores faltantes. - Agregar por cada variable con valores faltantes una columna con el mismo flag por fila. - Agregar una variable que indique el ratio o proporción de datos faltantes en una fila o bien cosas como (sin NA / total) o (NA/ sin NA) teniendo una idea sobre la "calidad de la info en una fila" y agregando esto al modelo que se haga.
@codificandobits
@codificandobits 3 жыл бұрын
Excelente aporte Johan, gracias por complementar lo mencionado en el video con esos trucos mencionados en (3). Y totalmente de acuerdo con lo que mencionas en (1): experiencia, experiencia y experiencia. Un saludo!
@juakonap
@juakonap 3 жыл бұрын
Profesor: Muchas gracias por su contenido. Respecto a este contenido, es importante hace algunas precisiones: 1. No siempre hay que realizar imputación o eliminación de datos faltantes, pues ese dato faltante también puede representar información clave. 2. Todo medio de interpolación para imputación de valores debe considerar el espacio muestral subyacente, es decir tener cuidado con la imputación de valores "fuera de muestra". Saludos!
@codificandobits
@codificandobits 3 жыл бұрын
Totalmente de acuerdo Joaquín, muchas gracias por tu aporte y un saludo!
@alejandratorres3857
@alejandratorres3857 3 жыл бұрын
Muchas gracias por la información. Acabo de dar con su canal y ya voy por mi tercer video, desde mi perspectiva, su canal es uno de los más enriquecedores en estos temas, muy didáctico y completo, muchas felicidades !!
@codificandobits
@codificandobits 3 жыл бұрын
Me motiva mucho ver estos comentarios Alejandra. Bienvenida al canal y un saludo!
@feliperuiz4063
@feliperuiz4063 Жыл бұрын
Una joya este canal :)
@juanandresnp
@juanandresnp 3 жыл бұрын
Muchas gracias, logras explicar de una forma sencilla y practica, uno de los grandes problemas que se encuentran habitualmente, un Saludo
@codificandobits
@codificandobits 3 жыл бұрын
:) :) gracias por tu comentario Juan Andrés. Un saludo!
@carlosjuniorchuquillanquih7591
@carlosjuniorchuquillanquih7591 Жыл бұрын
Muy buen video profesor, tengo una duda, llevo trabajando con un dataset sobre atenciones oncológicas, sin embargo, embargo hay una variable que es fecha de atención en el cual hay muchos datos faltantes, no se si sería recomendable aplicar alguna de las técnicas que menciono o solo eliminar esa columnar ya que no es relevante para el modelo de machine learning, muchas gracias profe.
@diegonovaarevalo8309
@diegonovaarevalo8309 3 жыл бұрын
Un excelente insumo, gracias por compartirlo!
@alejandroalvarez5403
@alejandroalvarez5403 8 ай бұрын
Excelente. Consulta... el link a la guia donde se encuentra? Gracias
@mariafernandaprietovargas1930
@mariafernandaprietovargas1930 2 жыл бұрын
Hola, excelente tu canal una prgunta cuando tengo informacion faltante de variables categoricas que nos son numerica puedo aplicar alguno de estos modelos?
@rubenquispe2952
@rubenquispe2952 17 сағат бұрын
La imputacion de Algoritmo MICE es un metodo extacto. La cuestion es que hay que saber manejar, por ejemplo en el video a la vista se ve que los datos no van a una disribucion normal por eso salio el valor 0,999 que no es dato real. Por tanto habra que tranformar los datos y luego recien aplicar el metodo.
@sjara91
@sjara91 2 жыл бұрын
Muchas gracias por tu contenido! me ha ayudado muchísimo. Un gran saludo!
@codificandobits
@codificandobits 2 жыл бұрын
Gracias por tu comentario Sebastián. Si te interesa profundizar en este u otros temas quedo atento a tus sugerencias. Un saludo!
@davidalejandrogarciamoncad5566
@davidalejandrogarciamoncad5566 3 жыл бұрын
Me hiciste recordar la prueba de Little para comprobar que los datos estén MCAR...
@naylamp_gaming
@naylamp_gaming Жыл бұрын
Que buena explicacion
@Bondobonco
@Bondobonco 3 жыл бұрын
Gracias por el video muy bueno! Favor incluir Series de tiempo!!
@codificandobits
@codificandobits 3 жыл бұрын
Hola! Tomo nota de tu sugerencia. Un saludo!
@fernandomendoza756
@fernandomendoza756 3 жыл бұрын
Gracias por la información
@nicoux9581
@nicoux9581 3 жыл бұрын
Impresionante 👌 👏😁
@zzzgerardo
@zzzgerardo 3 жыл бұрын
Miguel muy bueno el video, yo llego hasta un analisis de correlacion con alguna otra variable para poder calcular la media del grupo al cual pertenezca, como una agrupacion K pero artesanal.
@codificandobits
@codificandobits 3 жыл бұрын
Y no has probado con k-vecinos directamente?
@sergiotiria3443
@sergiotiria3443 3 жыл бұрын
Excelente Video
@juanfernando6962
@juanfernando6962 3 жыл бұрын
Excelente video, muchas gracias!!
@codificandobits
@codificandobits 3 жыл бұрын
Gracias por tu comentario Juan Fernando. Saludos!
@machine_learning
@machine_learning 3 жыл бұрын
Deberias por favor sacar un curso
@codificandobits
@codificandobits 3 жыл бұрын
Sí Anthony, desde el 10 de julio vienen los cursos. Un saludo!
@ebersolorzano6448
@ebersolorzano6448 Жыл бұрын
Excelente 👍
@edwardrain47
@edwardrain47 3 жыл бұрын
He intentado hacer relleno de datos en series de tiempo con redes recurrentes, pero el problema es la cantidad de datos nulos consecutivos, para ese caso las predicciones las realiza muy mal
@juanmanuelcirotorres6155
@juanmanuelcirotorres6155 3 жыл бұрын
Gracias profesor, genial como siempre
@rockophill3934
@rockophill3934 2 жыл бұрын
MAESTRO!!!
@vegamuni
@vegamuni 2 жыл бұрын
9:45. un autoencoder entrenado con los registros completos imputará los datos faltantes.
La Matriz de Confusión
10:54
Codificando Bits
Рет қаралды 10 М.
¿Cómo manejar los VALORES EXTREMOS en nuestros datos?
27:15
Codificando Bits
Рет қаралды 8 М.
When Cucumbers Meet PVC Pipe The Results Are Wild! 🤭
00:44
Crafty Buddy
Рет қаралды 60 МЛН
FOREVER BUNNY
00:14
Natan por Aí
Рет қаралды 32 МЛН
Imputación de datos faltantes para series de tiempo - Tutorial en R #RStudio
12:36
Un geógrafo en YouTube
Рет қаралды 3,3 М.
Imputación (o Manejo de Datos Faltantes) con Python
23:33
Codigo Maquina
Рет қаралды 11 М.
¿Cómo hacer el ANÁLISIS EXPLORATORIO DE DATOS?: guía paso a paso
13:54
¿Cuándo usar el Machine Learning?
13:41
Codificando Bits
Рет қаралды 10 М.
Cómo trabajar datos faltantes en un data set en Python
23:31
Escuela De Bayes
Рет қаралды 6 М.
Tutorial: LIMPIEZA DE DATOS con Python y Pandas
33:48
Codificando Bits
Рет қаралды 49 М.
¿Cómo seleccionar el MEJOR MODELO en un problema de Machine Learning?
12:24