Análisis de Componentes Principales (PCA) en R y Rstudio [Chupito de R] pca

  Рет қаралды 41,104

Pablo Vallejo Medina

Pablo Vallejo Medina

Күн бұрын

#PCA #APC #Análisis de componentes principales
Si te gusta mi contenido y quieres, puedes pagarme un café en: ko-fi.com/chup... así no me dormiré mientras hago los chupitos.
En este nuevo chupito de R os explico cómo hacer un ACP o PCA en R y Rstudio con la base de datos de superheroes de Marvel y DC. Se trata de un videotutorial para aprender análisis de componentes principales en R. Vamos a adentrarnos en los paquetes de factoextra y FactoMineR. Veremos también cómo hacer un biplot y diferentes formas de visualizar este algortimo de Machine Learning y Data Science. pca.
Y como siempre la sintaxis en:
github.com/pab...

Пікірлер: 90
@nicolastovar8121
@nicolastovar8121 3 жыл бұрын
Muchas gracias Pablo ayudas a mucha gente muy noble de tu parte :3
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
A ti, un placer!!!
@williamswill3229
@williamswill3229 2 жыл бұрын
gracias justo lo que necesitaba, me salia ese mismo error por las identidades de los encuestados, mil gracias
@carloss8235
@carloss8235 3 жыл бұрын
Ey! Eres muy bueno eh?? Vas al grano y se entiende muy bien. gracias
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Para nada, este es un mundo inmenso y yo solo sé un poco de una parte pequeña ;)
@leneko0034
@leneko0034 2 жыл бұрын
Muy bueno el video y el script. Gracias!
@jeisonbarrazamendez
@jeisonbarrazamendez 6 ай бұрын
Excelente video y script!
@blackcloud7201
@blackcloud7201 3 жыл бұрын
Mi hermano eres el mejor, gracias por tu tiempo.
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Un saludo ;)
@alejobecat
@alejobecat 3 жыл бұрын
Impecable como siempre, Pablo. ¡Muchísimas gracias!
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
De nada, un placer ;)
@glairisasanchez1507
@glairisasanchez1507 9 ай бұрын
@@PabloVallejoMedinanecesito un correo electrónico para contactarlo por favor 🙏
@PabloVallejoMedina
@PabloVallejoMedina 9 ай бұрын
@@glairisasanchez1507 pableres@gmail.com
@luciasoler1442
@luciasoler1442 2 жыл бұрын
Hola Pablo, saludos desde Argentina. Me encanta cómo explicas todo con tanta claridad y utilizando ejemplos que contienen obstáculos porque en la realidad pasa eso todo el tiempo con RStudio. Quería consultarte en el caso de un ACP se pueden utilizar como atributos ó categorías, datos que son "dependientes" entre sí. Por ejemplo, atributos que llevan porcentajes y cuya suma total da 100.
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Hola, la idea es que los datos sean dependientes, sino no tendría mucho sentido buscar categorías de agrupación (con base a qué se iban a agrupar). Lo de los porcentajes es una buena pregunta. A priori no hay contraindicación matemática, pero depende de cómo estén los datos estructurados. HAz una prueba a ver si te da algo cohertente y me cuentas. Todo lo que te puede pasar es que te salga un solo componente muy vectorizado, entonces no tendría mucho sentido.
@luciasoler1442
@luciasoler1442 2 жыл бұрын
@@PabloVallejoMedina Muchas gracias por tu respuesta. Estuve pensando en agregar un par de variables más, además de estas que te comenté que suman 100. Ya te cuento, en cuanto tenga algo resuelto con el biplot. En breve te invito un café virtual :)
@lauramontagut5690
@lauramontagut5690 Жыл бұрын
Holaa ! Excelente video me ayudaste mucho a mejorar mis graficas. Me podrías ayudar con algo. ¿ Como podría obtener un convex hulls de los grupos en lugar de los ellipses? Gracias nuevamente !
@fiorellaalcpiz5067
@fiorellaalcpiz5067 Жыл бұрын
Gracias por este chupito! me licenciaré por tí jaja
@PabloVallejoMedina
@PabloVallejoMedina Жыл бұрын
Un shot a mi salud!!
@marianaossayepes2357
@marianaossayepes2357 3 жыл бұрын
Muchísimas gracias por el video, me sirvió mucho. Tengo una duda: ¿Cuál fue el motivo de insertar los componentes PCA1 y PCA2 en la base de datos original si los gráficos los realizas con los resultados del PCA (respca2)?
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Hola, no entiendo muy bien tu pregunta. Pongo los dos componentes primeros, no sé si los saqué con la misma sintaxis o con otra, pero esos son los dos componentes que decidí aislar. Luego las visualizaciones pueden ser las mismas u otras.
@irenebernabeu517
@irenebernabeu517 2 жыл бұрын
Buenas, ahí va mi pregunta: Yo tengo que hacer un PCA y tengo muestras en la que se han medido las variables pero no de forma completa, es decir, hay espacios en blanco, es posible hacer la PCA de todos modos o debo extrapolar/inferir los valores que me faltan de las variables?
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Hola, en R cada paquete y cada función puede manejarse de forma diferente con los casos perdidos. Puede que no te deje hacerlo, puede que implemente un método de estimación por defecto... Tendrías que revisar la documentación del paquete. Lo otro es que tú, personalmente, manejes esos datos de antemano. Esa sería mi recomendación.
@albertocanomoreno5880
@albertocanomoreno5880 3 жыл бұрын
buen video, solo una pregunta: en que se basa para caracterizar a los personajes en bueno y malos?
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
La propia base de datos te lo dice. Batman, spiderman, superman = buenos. El jocker, rhino y thanos = malos
@yotu3234
@yotu3234 3 жыл бұрын
Gracias por los chupitos de R. Sigue asi!
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Muchas gracias!!!
@ameribaetis
@ameribaetis 2 жыл бұрын
Hola Pablo, he podido notar que la base de datos del ejemplo tiene valores de "0" (minuto 1:27) y el comando "respca
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Hola, Sandy. Parece ser que tienes una constante, es decir una variable donde todos los datos son el mismo. Si esto es así el PCA peta. elimínala y reintenta.
@teresalucilaaraujomoreno4654
@teresalucilaaraujomoreno4654 Жыл бұрын
Hola tengo una consulta con mi base de datos, en el video indica que hay que eliminar los names repetidos en mi caso seria familias que tienen 5 repeticiones cada una, al eliminar no afectaria el analisis de PCA?
@PabloVallejoMedina
@PabloVallejoMedina Жыл бұрын
Hola Teresa, no sé muy bien para qué quieres el PCA. La inmensa mayoría de bases de datos -quizá menos Excel- no te van a dejar tener variables repetidas. El PCA tampoco te va a funcionar con nombres idénticos. Simplemente haz que no tengan los mismos nombres. Saludos!
@Gamamarc92
@Gamamarc92 3 жыл бұрын
Hola buen video. Una duda, porque salen diferentes los componentes en R que cuando lo hago con otro Software ??
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Los algoritmos pueden variar un poco de un programa a otro ;)
@joseperezcastillo9382
@joseperezcastillo9382 2 жыл бұрын
muy buen videos, pero tengo una duda cuando hago correr el comando "ggbiplot(respca2,ellipse=TRUE, labels=rownames(df), groups=grupo)" me aparece el mensaje "Error in chol.default(sigma) : the leading minor of order 2 is not positive definite", y no me agrupan los datos, quisiera consultar como reparar este error porfavor.
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Parece que tienes pocos datos o son un poco caóticos. Pero podría ser otra cosa... échale un ojo: stackoverflow.com/questions/51064686/error-in-chol-defaultcxx-the-leading-minor-of-order-is-not-positive-definite
@rociodelpilargalindolujan550
@rociodelpilargalindolujan550 3 жыл бұрын
Hola Mario. Están muy interesantes tus vídeos. Ya pagué tu café para que no te duermas☺ jejejeje... Podrías hacer un para PLSDA y consultarte si das clases en R con certificado. Gracias. ❤
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Hola Rocío, gracias por el Ko-fi. Yo no doy clases particulares, pero Renzo Caceres Rossi (búscalo por Facebook) sí lo hace. También te recomiendo los cursos de DataCamp. Lo del PLSDA aprendo y hago el chupito.
@saioaparis3348
@saioaparis3348 2 жыл бұрын
Gracias por solucionarme el TFG jeje :)
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
El TFG te lo has solucionado tú misma buscando recursos, encontrando el que necesitabas y teniendo la destreza para aplicarlo a otro contexto. Seguro que sin mi video también lo hubieras logrado ;).
@franciscogalvez8426
@franciscogalvez8426 3 жыл бұрын
Muy bueno como siempre Pablo. Veremos algún Chupito de SEM?
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Hay algunos de afc, pero como modelos aún no he hecho ninguno. A ver si lo apunto a la hoja de pendientes.
@marlonedy55
@marlonedy55 2 жыл бұрын
Podrías realizar un vídeo de RDA en R. Saludos desde Ecuador
@joseorlandoramossanchez7474
@joseorlandoramossanchez7474 3 жыл бұрын
Hola Pablo me gustó mucho tu forma de explicar este tema, la verdad quede muy entuciasmado con lo que aprendí, me gustaría saber si puedes realizar un Klustering pero con datos nominales, en mi caso tengo una base de datos con clientes de diferentes regiones y pertenecientes a diferentes mercados y me gustaría realizar este proceso convinando los tipos de datos que tengo.
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
mira a ver si el kluster de kamedioids (del que tengo un chupito) te sirve ;)
@alejandrocastrocegri2645
@alejandrocastrocegri2645 2 жыл бұрын
Buenas muchas gracias por el video es muy claro pero tengo una duda, podría quitar los títulos de cada individuo en la gráfica mostrada por fviz_pca_biplot y quedarme solamente con los símbolos y color correspondiente a cada grupo?
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Sí, claro. Aquí tienes varios ejemplos.
@jeanpierrerodriguezmirano5317
@jeanpierrerodriguezmirano5317 3 жыл бұрын
Hola ¿Es decir que no se puede trabajar con variables con letras en este análisis? ¿ Tengo dos variables categóricas que no me gustaría dejar fuera, ¿qué puedo hacer?
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Pasarlas a factores y a ver que pasa. También tienes lo análisis de correspondencia ;)
@pitopizoide
@pitopizoide Жыл бұрын
Gracias por el video! Tengo una duda: una vez que obtengo el plot con el comando ggbiplot(respca2,ellipse=TRUE, labels=rownames(df), groups=grupo), como puedo indicarle que me grafique solo las variables que mas contribuyen? Mil gracias!!!
@jaimeisaacpena8341
@jaimeisaacpena8341 2 жыл бұрын
Excelente video muchas gracias!! Puedes compartir la base de datos o dataset
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Hola Jaime, la base de datos la tienes en los comentarios.
@camilomiranda2027
@camilomiranda2027 3 жыл бұрын
Hola Pablo, muy chevere tu tutorial, podrías hacer un ejemplo para datos categoricos?
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Hola, yo nunca utilizaría un PCA para datos categóricos. Se me ocurre mejor un AFE con la matriz policórica. De esto último ya hay chupito.
@raulcardenasful
@raulcardenasful 3 жыл бұрын
Análisis de correspondencia
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
@@raulcardenasful Totalmente ;)
@carlosauc
@carlosauc 2 жыл бұрын
Hola buen dia. He generado un grafico indv-PCA con elipses. Sin embargo para cada punto se muestra un numero. Megustaria cambiar ese numero por el texto correspondiente para cada punto. Como lo puedo hacer? gracias
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
mhhh...teniendo los nombres de las variables en la columna en vez de los números. Lo hago en el otro video de PCA que tengo ;)
@carlosauc
@carlosauc 2 жыл бұрын
@@PabloVallejoMedina perfecto, lo ví. Gracias por el tip.
@LausEtJubilatio
@LausEtJubilatio 2 жыл бұрын
EXCELENTE
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Muchas gracias por el comentario y por el café ;)
@ezequielsaavedra6152
@ezequielsaavedra6152 3 жыл бұрын
muy bueno! solo una duda, como hago para descargar los datos? entre en el link de la primera fila pero no puedo descargarlo
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
qué raro, prueba en: github.com/cosmoduende/r-marvel-vs-dc/tree/main/dataset_shdb
@patriciagomez2739
@patriciagomez2739 3 жыл бұрын
trato de poner una variable de un archivo csv a nom,bre de columna pero no me deja...esporque tu comando es solo para archivos de excel????
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
no habrás cargado bien el paquete, ¿no?
@luishernandezhernandez1640
@luishernandezhernandez1640 3 жыл бұрын
Donde descargo la base de datos?
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
En la primera línea de sintaxis está la url de la descarga ;)
@winedj8466
@winedj8466 3 жыл бұрын
@@PabloVallejoMedina gracias Pablo :D
@winedj8466
@winedj8466 3 жыл бұрын
graciaaaas
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
De nada ;)
@drsalvadormanrique3118
@drsalvadormanrique3118 2 жыл бұрын
jaja, yo creo que OnlyFan es mejor negocio que la ciencia! Gracias por el video. Muy útil.
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
No te creas, me abro un OnlyFans y salgo a pagar ;)
@EXXNmmmm
@EXXNmmmm 3 жыл бұрын
Lo del ko-fi es una buena idea. Ya el de hoy te lo he pagado.
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
ya; pero tu no cuentas ;)
@AdlerDiaz
@AdlerDiaz Жыл бұрын
Puedes compartir tu excel por favor, Gracias
@PabloVallejoMedina
@PabloVallejoMedina Жыл бұрын
En la descripción está. O si no en el video digo de donde lo saco.
@LuisSuarez-pt3rw
@LuisSuarez-pt3rw 3 жыл бұрын
Me gustaría quee ayude sobre una acs en r me puede ayudar
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
qué necesitas?
@LuisSuarez-pt3rw
@LuisSuarez-pt3rw 3 жыл бұрын
Te mandaría el algoritmo de R studio y la base de datos para ver dónde estoy equivocado muchas
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
@@LuisSuarez-pt3rw mándamela a mi correo: pableres@gmail.com y le echo un vistazo y te digo cuanto costaría el servicio según como esté.
@LuisSuarez-pt3rw
@LuisSuarez-pt3rw 3 жыл бұрын
Ok
@tziraatmolina9979
@tziraatmolina9979 2 жыл бұрын
¿Alguien sabe si la variable de "bueno, malo o neutral" se puede visualizar?
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Hola crack, sí si se puede. Pero... qué tipo de visualización?
@CesarMolinaMora
@CesarMolinaMora Жыл бұрын
l base de datos no esta git
@PabloVallejoMedina
@PabloVallejoMedina Жыл бұрын
Sí, ahí está: github.com/cosmoduende/r-marvel-vs-dc
@Zamihyalina
@Zamihyalina Жыл бұрын
No me funcionó tu video :( pero explicas muy bien
@PabloVallejoMedina
@PabloVallejoMedina Жыл бұрын
mhhh.. qué error te da?
@josereyeslovato
@josereyeslovato 2 жыл бұрын
library(devtools) install_github("vqv/ggbiplot", force = TRUE) Use este comando para instalar el ggbiplot SALUDOS
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Muchas gracias !!!
@jorgegonzalezcampos4434
@jorgegonzalezcampos4434 2 жыл бұрын
Ya no funciona 😕
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
@@jorgegonzalezcampos4434 seguro que hay formas
Análisis de componentes principales (PCA)
31:10
Serrano.Academy en Español
Рет қаралды 26 М.
[K means] Análisis de Clúster en R y Rstudio. [Chupitos de R]
22:51
Pablo Vallejo Medina
Рет қаралды 60 М.
Synyptas 4 | Жігіттер сынып қалды| 3 Bolim
19:27
kak budto
Рет қаралды 1,3 МЛН
Don't look down on anyone#devil  #lilith  #funny  #shorts
00:12
Devil Lilith
Рет қаралды 45 МЛН
How I Turned a Lolipop Into A New One 🤯🍭
00:19
Wian
Рет қаралды 10 МЛН
Smart Sigma Kid #funny #sigma
00:14
CRAZY GREAPA
Рет қаралды 4,1 МЛН
Cómo hacer correlaciones en Rstudio y R. [Chupito de R]
16:25
Pablo Vallejo Medina
Рет қаралды 42 М.
Análisis exploratorio con ACP en R
10:59
Rocio Chavez Ciencia de Datos
Рет қаралды 14 М.
2024-10-09 | Inferencia Estadística | Ajuste de un Modelo Mixto.
54:42
Sergio Martín Martínez Pérez
Рет қаралды 52
StatQuest: Principal Component Analysis (PCA), Step-by-Step
21:58
StatQuest with Josh Starmer
Рет қаралды 2,9 МЛН
Análisis de Componentes Principales: Maximización de varianza
1:19:08
Análisis de Componentes Principales con RStudio Paso a Paso!
40:39
Cómo hacer un Análisis Factorial Exploratorio en R. [Chupitos de R]
19:15
Pablo Vallejo Medina
Рет қаралды 19 М.
21 - Análisis de componentes principales en RStudio
23:23
Juan Gabriel Gomila
Рет қаралды 53 М.
Synyptas 4 | Жігіттер сынып қалды| 3 Bolim
19:27
kak budto
Рет қаралды 1,3 МЛН