Análisis exploratorio con ACP en R

  Рет қаралды 15,190

Rocio Chavez Ciencia de Datos

Rocio Chavez Ciencia de Datos

Күн бұрын

Si te sirvió el vídeo y deseas apoyarme directamente, te dejo mi cuenta Paypal 😊:
www.paypal.com...
Mis cursos en línea:
======================
Aplica SQL al Mundo del Data Science
Creación de Reportes Visuales con RMarkdown
rociochavezml....
Descarga los archivos que voy analizando en: github.com/roc...
Blog "Aprende Ciencia de Datos con Rocío Chávez": rociochavezml....
Espero que mis videos te estén siendo de utilidad. Si gustas cooperar por medio de PayPal para poder seguir creando contenido, puedes hacerlo en la página de mi Blog
En esta ocasión aplicaré el Análisis de Componentes Principales a una base de datos que contiene información acerca de una encuesta realizada por el Instituto Nacional de Estadística y de Estudios Económicos de Francia, en el año 2006.
En ella se pueden observar grupos de individuos según su edad y el monto total que ha gastado cada uno de estos grupos en diferentes rubros, tales como transporte, salud, comunicaciones, y alimentación entre otros.
Algunas de las preguntas que podemos plantearnos al ver este tipo de información son:
En que gastan más, o menos, las personas jóvenes?... Y los más ancianos?
Existen grupos de edad cuyos patrones de gastos sean similares?
De ser así, en qué son similares?
Cuales productos podría ofrecer juntos a un determinado grupo de personas en base a su edad?
Los archivos que voy utilizando los puedes encontrar en:
github.com/roc...
Algunos archivos no los encontrarás en el link, ya que se van creando al correr los códigos que vienen en los videos y estos se grabarán en tu computadora.
Si quieres aprender más acerca de este tipo de técnicas, suscríbete a mi canal, en donde estaré subiendo videos de Machine Learning, Estadística y de Matemáticas en general aplicadas a los negocios.
Si conoces a alguna persona a la que le pudiera ser de utilidad esta información, por favor ayúdame a compartirla. Te lo agradeceré muchísimo 😉
#machinelearning #datascience #statistics

Пікірлер: 57
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 2 жыл бұрын
Obtén los scripts, archivos y diapositivas que se muestran en mis videos en: www.patreon.com/rociochavezcienciadedatos
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 3 жыл бұрын
Si te fue de utilidad este video y deseas ayudarme a seguir creando contenido, puedes hacerlo de varias formas: - Dando clic en "Me gusta" para incrementar la probabilidad de que el algoritmo de KZbin promueva mi contenido - Dejándome un comentario - Suscribiéndote a mi canal - Compartiendo mi canal en tus redes sociales - Presionando el ícono "Gracias" y haciendo una donación
@armandojhuniormercado9711
@armandojhuniormercado9711 3 жыл бұрын
Mil gracias =). Justo estoy cursando Técnicas Multivariadas donde el primer tema fue PCA. Este video reforzó más mis conocimientos.
@RoyerNadian1
@RoyerNadian1 4 жыл бұрын
Desde Hoy será mi Profe preferida. Que buena explicación, Mil gracias Gracias.
@chagoignacio
@chagoignacio 3 жыл бұрын
Muy buena la explicación, eres super clara para enseñar. Te felicitó......
@sussybaka119
@sussybaka119 Жыл бұрын
Esto fue de hecho bastante útil, yo me estaba complicando
@germanuc
@germanuc 11 ай бұрын
Muy bien explicado Rocio, gracias
@analaurabecerra2221
@analaurabecerra2221 4 жыл бұрын
Muchas gracias por tu vídeo, es muy bueno, me sirvió mucho para resolver unas bases de datos que no encontraba bien como darle solución y que son para mi trabajo. Todo tu trabajo, vídeos son muy buenos, gracias por compartir los vídeos!!
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Es un placer! Muchas gracias por tus palabras Ana Laura! ;)
@jairobejarano-vergara6097
@jairobejarano-vergara6097 4 жыл бұрын
Muchas gracias por tú ejemplo!
@ramseslandaverde1378
@ramseslandaverde1378 4 жыл бұрын
Excelente tutorial. Muchas gracias por tu valioso tiempo.
@fabianazas3744
@fabianazas3744 2 жыл бұрын
muy bien explicado
@ferhf824
@ferhf824 6 ай бұрын
eres la mejor muchas gracias :3
@tensoescalar1
@tensoescalar1 4 жыл бұрын
Excelente Video, gracias
@juankbta66012058
@juankbta66012058 4 жыл бұрын
Gracias!, excelente explicación
@pallo_gamer
@pallo_gamer 4 жыл бұрын
profe sus videos son increíbles, gracias !!
@emilianocaballerovazquez7798
@emilianocaballerovazquez7798 4 жыл бұрын
Buenísimo
@h.limaymanta
@h.limaymanta 4 жыл бұрын
Hola Rocío, gracias por tu vídeo. Dos preguntas, 1) en el conjunto de datos mencionas que los valores son el gasto total de cada grupo de edad, ¿a cambio de gasto total se puede usar el gasto promedio? 2) En la gráfica de ACP ¿los valores del eje x e y son gastos estandarizados?
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Hola César! Puedes utilizar los datos que a ti te convegan, dependiendo de la información que deseas obtener. El eje de las x's pertenece a los valores del componente 1, no representa los gastos estandarizados.
@h.limaymanta
@h.limaymanta 4 жыл бұрын
Gracias.
@jaiderjimenez6959
@jaiderjimenez6959 4 жыл бұрын
Muchas gracias por darnos tu conocimiento de esta forma tan didáctica y pedagógica. Además, tu tono de voz es agradable. ¿Tienes algún blog donde se puedan descargar los códigos y bases de datos para recrear el ejercicio?
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Muchas gracias por tus palabras Jaider! Los archivos los puedes descargar del link de GitHub que viene en la descripción. Los códigos no los tengo disponibles :(
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 3 жыл бұрын
Si estás interesado en adquirir alguno de mis cursos en línea, vista mi página web rociochavezml.com/cursos-en-linea/ ;)
@aldoyactayo05
@aldoyactayo05 4 жыл бұрын
Rocio, buenas noches, una consulta en el caso de tener datos NA en las columnas. Como se procederia? Muchas gracias!
@mariotrinidad8650
@mariotrinidad8650 4 жыл бұрын
Hola Rocío, que bien explicas, voy a compartir tu vídeo. Una pregunta, mencionas que el ACP no es muy conveniente cuando son muchas variables porque no se distinguen en el círculo de correlaciones, entonces cuál sería otro método que grafique esas variables sin problemas?
@YannCal24
@YannCal24 4 жыл бұрын
Buena pregunta! tengo ese problema
@pamelaperez7453
@pamelaperez7453 3 жыл бұрын
Muchas gracias Profe, me encanto su video. Pregunta, ¿las variables están estandarizadas?
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 3 жыл бұрын
Hola Pamela, La verdad ya no recuerdo bien el pre-procesamiento que hice a este archivo, sin embargo, al momento de llevar a cabo el ACP, lo primero que hace el algoritmo es estandarizar los valores para después calcular los componentes principales ;)
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Si deseas conocer acerca del clustering K-Means, que es otro método útil en el análisis exploratorio, puedes ver el video Clustering con K-Means. Explicación Matemática y Mucho más… kzbin.info/www/bejne/pGqbl6GJetSFn68
@ismaeltavarez6733
@ismaeltavarez6733 4 жыл бұрын
Hola Rocío!, de casualidad tendrás material de Análisis de Correspondencia en Rstudio y puedas compartir. Saludos y gracias por todo el material que compartes
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Hola Ismael! No tengo material acerca del análisis de Análisis de Correspondencia :(
@raymondjoseph3556
@raymondjoseph3556 Жыл бұрын
Buenos dias, yo tengo una duda sobre PCA , para hazer PCA los dados tienen que estar normalizado??? yo tengo que transformar los dados???
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos Жыл бұрын
En lenguaje R la función PCA que se muestra aquí los normaliza antes de comenzar todo el proceso. Si utilizaras otro lenguaje, es recomendable estandarizar los datos antes de llevar a cabo el PCA ya que no todas las implementaciones normalizan los datos antes de obtener los componentes principales
@IngridYuliethGomez-r1l
@IngridYuliethGomez-r1l 4 ай бұрын
donde encuentro la base de datos que uso para realizar ACP?- Gracias.
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 ай бұрын
Hola Ingrid! Los archivos que voy utilizando se encuentran en github.com/rociochavezmx/Rocio-Chavez-youtube-Files
@LuisSuarez-pt3rw
@LuisSuarez-pt3rw 4 жыл бұрын
hola como esta me gustaria saber como hacer que los componentes pricipales sea en asignatura de 13 y asignada de acuerdo con los desempeño en el colegio con los estudiantes
@susanaolveramoreno5447
@susanaolveramoreno5447 4 жыл бұрын
Hola Rocio, exclente video, no sabes como me ayudo, quisiera saber si me puedes orientar en como visualizar los eigenvectores y eigenvalores del Analisis de Componentes Principales
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Hola Susana! Me dá gusto que te haya sido de utilidad el video. Los eigenvalores los puedes encontrar en el apartado eig del acp, en este ejemplo, están en acp_compras$eig y los eigenvectores están en acp_compras$var$coord. La información que contiene el acp la puedes ver con el comando str(acp_compras) o dando dos clics en acp_compras en el panel environment
@susanaolveramoreno5447
@susanaolveramoreno5447 4 жыл бұрын
@@RocioChavezCienciadeDatos Muchas gracias, por casualidad ha realizado algún video donde use PRINCOMP? ya que en este proceso mis valores de ACP me salen diferentes a los que arroja PRINCOMP, lo hice con la matriz de covarianzas, pero en este proceso no se como lo hace el programa, pero las grafías que obtiene aquí, son justo lo que necesito expresar!!
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
@@susanaolveramoreno5447 No he utilizado el comando princomp :(
@susanaolveramoreno5447
@susanaolveramoreno5447 4 жыл бұрын
@@RocioChavezCienciadeDatos Muchas gracias por tomarte el tiempo de responder
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
@@susanaolveramoreno5447 es un placer! ;)
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Para llevar a cabo el pre-procesamiento de tus datos y poder obtener información confiable en tus análisis, visita mi lista de reproducción llamada Pre-procesamiento de Datos en R kzbin.info/aero/PLUofJx5RUeFqGJJxKflkhDRTot29M7CYj
@angienorelismendozaperez6840
@angienorelismendozaperez6840 3 жыл бұрын
Hola Rocio Chavez, me encantan tus videos cargados de mucha informacion, tengo problemas con la librería factoMiner, me dice que no es compatible con mi versión de Rstudio, que puedo hacer?
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 3 жыл бұрын
Hola Angie! Hace unos dias subí un video en donde explico cómo instalar paquetes de versiones anteriores. Tal vez te sirva. El video está en el siguiente enlace: kzbin.info/www/bejne/naKWd36Lrrtrmbc&ab_channel=RocioChavezCienciadeDatos
@angienorelismendozaperez6840
@angienorelismendozaperez6840 3 жыл бұрын
@@RocioChavezCienciadeDatos Muchas Gracias por tu tiempo, saludos. bendiciones
@patriciamariaolmosmoya4726
@patriciamariaolmosmoya4726 4 жыл бұрын
Hola! Muy interesantes tus videos. Colmados de información. Podrías recomendarme algún (s) libros de estadística, básica? Gracias!
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Hola Paty! Gracias por tus comentarios. Hay un libro cuyo título es "Estadísticas y Econometría Financiera" de Eduardo Court Monteverde que me parece muy completo. ;)
@patriciamariaolmosmoya4726
@patriciamariaolmosmoya4726 4 жыл бұрын
Rocio Chavez muchas gracias 🤓
@gustavoangelozabaleta
@gustavoangelozabaleta 4 жыл бұрын
Cuando son muchas variables que tecnica o correcion podria usar para el ACP
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Hola Gustavo, no comprendo tu pregunta. Si gustas, envíame un correo a rociochavezmx@yahoo.com
@raymondjoseph3556
@raymondjoseph3556 Жыл бұрын
Buenas noche como esta usted? usted puede me ajudar favor con analisis MOdelo linear misto (REML/ BLUP (Restricted Maximum Likelihood/Best Linear Unbiased Predicted) , como hacer os matrices, como analizar no R, favor???
@alexanderbautistavizcaino2139
@alexanderbautistavizcaino2139 4 жыл бұрын
Hola Rocio, muchas gracias por tu conocimiento. por otro lado no he podido descargar el archivo CSV , me ayudas
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Hola Alexander! Te dió algún problema el github que aparece en la descripción del video? Si gustas envíame un correo a rociochavezmx@yahoo.com para enviarte el archivo
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 4 жыл бұрын
Si estás interesado en conocer acerca de un algoritmo utilizado en el desarrollo de sistemas de recomendación, te recomiendo que veas mi video Algoritmo Apriori en R kzbin.info/www/bejne/nmjLgISNm82anpo ... ;)
@soniahernandez1797
@soniahernandez1797 3 жыл бұрын
Que aplicaciones es ?
@RocioChavezCienciadeDatos
@RocioChavezCienciadeDatos 3 жыл бұрын
Hola Sonia, es lenguaje R y RStudio. En mi canal hay un video acerca de cómo instalarlos ;)
Clustering Jerarquico sobre el ACP en R
13:41
Rocio Chavez Ciencia de Datos
Рет қаралды 4,1 М.
Algoritmo Apriori en R | Identificando patrones de comportamiento
30:50
Rocio Chavez Ciencia de Datos
Рет қаралды 11 М.
Enceinte et en Bazard: Les Chroniques du Nettoyage ! 🚽✨
00:21
Two More French
Рет қаралды 42 МЛН
We Attempted The Impossible 😱
00:54
Topper Guild
Рет қаралды 56 МЛН
It works #beatbox #tiktok
00:34
BeatboxJCOP
Рет қаралды 41 МЛН
Analisis de Componentes Principales ACP
1:38:28
Luis Felipe Rios Herrera
Рет қаралды 44 М.
Cómo comprobar los supuestos en R y Rstudio. [Chupitos de R]
33:41
Pablo Vallejo Medina
Рет қаралды 21 М.
ANÁLISIS DE DATOS. Método K-MEANS. CLUSTERING. RStudio.
4:47
Universitaty
Рет қаралды 1,7 М.
SERIES DE TIEMPO en R 📈 con RSTUDIO 💻
22:52
Rafa Gonzalez Gouveia
Рет қаралды 42 М.
Análisis Exploratorio de Datos en R
13:03
Lic. Lourdes Cuellar
Рет қаралды 15 М.
21 - Análisis de componentes principales en RStudio
23:23
Juan Gabriel Gomila
Рет қаралды 54 М.
Clustering Jerarquico de Series Temporales en R
14:20
Rocio Chavez Ciencia de Datos
Рет қаралды 5 М.
Cómo hacer un Análisis Factorial Exploratorio en R. [Chupitos de R]
19:15
Pablo Vallejo Medina
Рет қаралды 20 М.
Preprocesamiento de Datos en R: Escalado de Valores
11:28
Rocio Chavez Ciencia de Datos
Рет қаралды 6 М.
Enceinte et en Bazard: Les Chroniques du Nettoyage ! 🚽✨
00:21
Two More French
Рет қаралды 42 МЛН