Análisis de Componentes Principales (PCA) en R y Rstudio [Chupito de R] pca

Рет қаралды 43,076

Pablo Vallejo Medina

Күн бұрын

Пікірлер: 90

@nicolastovar8121 3 жыл бұрын

Muchas gracias Pablo ayudas a mucha gente muy noble de tu parte :3

@PabloVallejoMedina 3 жыл бұрын

A ti, un placer!!!

@blackcloud7201 3 жыл бұрын

Mi hermano eres el mejor, gracias por tu tiempo.

@PabloVallejoMedina 3 жыл бұрын

Un saludo ;)

@williamswill3229 2 жыл бұрын

gracias justo lo que necesitaba, me salia ese mismo error por las identidades de los encuestados, mil gracias

@carloss8235 3 жыл бұрын

Ey! Eres muy bueno eh?? Vas al grano y se entiende muy bien. gracias

@PabloVallejoMedina 3 жыл бұрын

Para nada, este es un mundo inmenso y yo solo sé un poco de una parte pequeña ;)

@jeisonbarrazamendez 10 ай бұрын

Excelente video y script!

@leneko0034 3 жыл бұрын

Muy bueno el video y el script. Gracias!

@alejobecat 3 жыл бұрын

Impecable como siempre, Pablo. ¡Muchísimas gracias!

@PabloVallejoMedina 3 жыл бұрын

De nada, un placer ;)

@glairisasanchez1507 Жыл бұрын

@@PabloVallejoMedinanecesito un correo electrónico para contactarlo por favor 🙏

@PabloVallejoMedina Жыл бұрын

@@glairisasanchez1507 pableres@gmail.com

@yotu3234 3 жыл бұрын

Gracias por los chupitos de R. Sigue asi!

@PabloVallejoMedina 3 жыл бұрын

Muchas gracias!!!

@fiorellaalcpiz5067 2 жыл бұрын

Gracias por este chupito! me licenciaré por tí jaja

@PabloVallejoMedina 2 жыл бұрын

Un shot a mi salud!!

@teresalucilaaraujomoreno4654 2 жыл бұрын

Hola tengo una consulta con mi base de datos, en el video indica que hay que eliminar los names repetidos en mi caso seria familias que tienen 5 repeticiones cada una, al eliminar no afectaria el analisis de PCA?

@PabloVallejoMedina 2 жыл бұрын

Hola Teresa, no sé muy bien para qué quieres el PCA. La inmensa mayoría de bases de datos -quizá menos Excel- no te van a dejar tener variables repetidas. El PCA tampoco te va a funcionar con nombres idénticos. Simplemente haz que no tengan los mismos nombres. Saludos!

@joseperezcastillo9382 2 жыл бұрын

muy buen videos, pero tengo una duda cuando hago correr el comando "ggbiplot(respca2,ellipse=TRUE, labels=rownames(df), groups=grupo)" me aparece el mensaje "Error in chol.default(sigma) : the leading minor of order 2 is not positive definite", y no me agrupan los datos, quisiera consultar como reparar este error porfavor.

@PabloVallejoMedina 2 жыл бұрын

Parece que tienes pocos datos o son un poco caóticos. Pero podría ser otra cosa... échale un ojo: stackoverflow.com/questions/51064686/error-in-chol-defaultcxx-the-leading-minor-of-order-is-not-positive-definite

@ameribaetis 2 жыл бұрын

Hola Pablo, he podido notar que la base de datos del ejemplo tiene valores de "0" (minuto 1:27) y el comando "respca

@PabloVallejoMedina 2 жыл бұрын

Hola, Sandy. Parece ser que tienes una constante, es decir una variable donde todos los datos son el mismo. Si esto es así el PCA peta. elimínala y reintenta.

@carlosauc 2 жыл бұрын

Hola buen dia. He generado un grafico indv-PCA con elipses. Sin embargo para cada punto se muestra un numero. Megustaria cambiar ese numero por el texto correspondiente para cada punto. Como lo puedo hacer? gracias

@PabloVallejoMedina 2 жыл бұрын

mhhh...teniendo los nombres de las variables en la columna en vez de los números. Lo hago en el otro video de PCA que tengo ;)

@carlosauc 2 жыл бұрын

@@PabloVallejoMedina perfecto, lo ví. Gracias por el tip.

@irenebernabeu517 2 жыл бұрын

Buenas, ahí va mi pregunta: Yo tengo que hacer un PCA y tengo muestras en la que se han medido las variables pero no de forma completa, es decir, hay espacios en blanco, es posible hacer la PCA de todos modos o debo extrapolar/inferir los valores que me faltan de las variables?

@PabloVallejoMedina 2 жыл бұрын

Hola, en R cada paquete y cada función puede manejarse de forma diferente con los casos perdidos. Puede que no te deje hacerlo, puede que implemente un método de estimación por defecto... Tendrías que revisar la documentación del paquete. Lo otro es que tú, personalmente, manejes esos datos de antemano. Esa sería mi recomendación.

@marlonedy55 2 жыл бұрын

Podrías realizar un vídeo de RDA en R. Saludos desde Ecuador

@saioaparis3348 2 жыл бұрын

Gracias por solucionarme el TFG jeje :)

@PabloVallejoMedina 2 жыл бұрын

El TFG te lo has solucionado tú misma buscando recursos, encontrando el que necesitabas y teniendo la destreza para aplicarlo a otro contexto. Seguro que sin mi video también lo hubieras logrado ;).

@jeanpierrerodriguezmirano5317 3 жыл бұрын

Hola ¿Es decir que no se puede trabajar con variables con letras en este análisis? ¿ Tengo dos variables categóricas que no me gustaría dejar fuera, ¿qué puedo hacer?

@PabloVallejoMedina 3 жыл бұрын

Pasarlas a factores y a ver que pasa. También tienes lo análisis de correspondencia ;)

@lauramontagut5690 Жыл бұрын

Holaa ! Excelente video me ayudaste mucho a mejorar mis graficas. Me podrías ayudar con algo. ¿ Como podría obtener un convex hulls de los grupos en lugar de los ellipses? Gracias nuevamente !

@marianaossayepes2357 3 жыл бұрын

Muchísimas gracias por el video, me sirvió mucho. Tengo una duda: ¿Cuál fue el motivo de insertar los componentes PCA1 y PCA2 en la base de datos original si los gráficos los realizas con los resultados del PCA (respca2)?

@PabloVallejoMedina 3 жыл бұрын

Hola, no entiendo muy bien tu pregunta. Pongo los dos componentes primeros, no sé si los saqué con la misma sintaxis o con otra, pero esos son los dos componentes que decidí aislar. Luego las visualizaciones pueden ser las mismas u otras.

@Gamamarc92 3 жыл бұрын

Hola buen video. Una duda, porque salen diferentes los componentes en R que cuando lo hago con otro Software ??

@PabloVallejoMedina 3 жыл бұрын

Los algoritmos pueden variar un poco de un programa a otro ;)

@luciasoler1442 3 жыл бұрын

Hola Pablo, saludos desde Argentina. Me encanta cómo explicas todo con tanta claridad y utilizando ejemplos que contienen obstáculos porque en la realidad pasa eso todo el tiempo con RStudio. Quería consultarte en el caso de un ACP se pueden utilizar como atributos ó categorías, datos que son "dependientes" entre sí. Por ejemplo, atributos que llevan porcentajes y cuya suma total da 100.

@PabloVallejoMedina 3 жыл бұрын

Hola, la idea es que los datos sean dependientes, sino no tendría mucho sentido buscar categorías de agrupación (con base a qué se iban a agrupar). Lo de los porcentajes es una buena pregunta. A priori no hay contraindicación matemática, pero depende de cómo estén los datos estructurados. HAz una prueba a ver si te da algo cohertente y me cuentas. Todo lo que te puede pasar es que te salga un solo componente muy vectorizado, entonces no tendría mucho sentido.

@luciasoler1442 3 жыл бұрын

@@PabloVallejoMedina Muchas gracias por tu respuesta. Estuve pensando en agregar un par de variables más, además de estas que te comenté que suman 100. Ya te cuento, en cuanto tenga algo resuelto con el biplot. En breve te invito un café virtual :)

@albertocanomoreno5880 3 жыл бұрын

buen video, solo una pregunta: en que se basa para caracterizar a los personajes en bueno y malos?

@PabloVallejoMedina 3 жыл бұрын

La propia base de datos te lo dice. Batman, spiderman, superman = buenos. El jocker, rhino y thanos = malos

@alejandrocastrocegri2645 2 жыл бұрын

Buenas muchas gracias por el video es muy claro pero tengo una duda, podría quitar los títulos de cada individuo en la gráfica mostrada por fviz_pca_biplot y quedarme solamente con los símbolos y color correspondiente a cada grupo?

@PabloVallejoMedina 2 жыл бұрын

Sí, claro. Aquí tienes varios ejemplos.

@rociodelpilargalindolujan550 3 жыл бұрын

Hola Mario. Están muy interesantes tus vídeos. Ya pagué tu café para que no te duermas☺ jejejeje... Podrías hacer un para PLSDA y consultarte si das clases en R con certificado. Gracias. ❤

@PabloVallejoMedina 3 жыл бұрын

Hola Rocío, gracias por el Ko-fi. Yo no doy clases particulares, pero Renzo Caceres Rossi (búscalo por Facebook) sí lo hace. También te recomiendo los cursos de DataCamp. Lo del PLSDA aprendo y hago el chupito.

@patriciagomez2739 3 жыл бұрын

trato de poner una variable de un archivo csv a nom,bre de columna pero no me deja...esporque tu comando es solo para archivos de excel????

@PabloVallejoMedina 3 жыл бұрын

no habrás cargado bien el paquete, ¿no?

@jaimeisaacpena8341 3 жыл бұрын

Excelente video muchas gracias!! Puedes compartir la base de datos o dataset

@PabloVallejoMedina 3 жыл бұрын

Hola Jaime, la base de datos la tienes en los comentarios.

@camilomiranda2027 3 жыл бұрын

Hola Pablo, muy chevere tu tutorial, podrías hacer un ejemplo para datos categoricos?

@PabloVallejoMedina 3 жыл бұрын

Hola, yo nunca utilizaría un PCA para datos categóricos. Se me ocurre mejor un AFE con la matriz policórica. De esto último ya hay chupito.

@raulcardenasful 3 жыл бұрын

Análisis de correspondencia

@PabloVallejoMedina 3 жыл бұрын

@@raulcardenasful Totalmente ;)

@luishernandezhernandez1640 3 жыл бұрын

Donde descargo la base de datos?

@PabloVallejoMedina 3 жыл бұрын

En la primera línea de sintaxis está la url de la descarga ;)

@winedj8466 3 жыл бұрын

@@PabloVallejoMedina gracias Pablo :D

@franciscogalvez8426 3 жыл бұрын

Muy bueno como siempre Pablo. Veremos algún Chupito de SEM?

@PabloVallejoMedina 3 жыл бұрын

Hay algunos de afc, pero como modelos aún no he hecho ninguno. A ver si lo apunto a la hoja de pendientes.

@joseorlandoramossanchez7474 3 жыл бұрын

Hola Pablo me gustó mucho tu forma de explicar este tema, la verdad quede muy entuciasmado con lo que aprendí, me gustaría saber si puedes realizar un Klustering pero con datos nominales, en mi caso tengo una base de datos con clientes de diferentes regiones y pertenecientes a diferentes mercados y me gustaría realizar este proceso convinando los tipos de datos que tengo.

@PabloVallejoMedina 3 жыл бұрын

mira a ver si el kluster de kamedioids (del que tengo un chupito) te sirve ;)

@LausEtJubilatio 3 жыл бұрын

EXCELENTE

@PabloVallejoMedina 3 жыл бұрын

Muchas gracias por el comentario y por el café ;)

@ezequielsaavedra6152 3 жыл бұрын

muy bueno! solo una duda, como hago para descargar los datos? entre en el link de la primera fila pero no puedo descargarlo

@PabloVallejoMedina 3 жыл бұрын

qué raro, prueba en: github.com/cosmoduende/r-marvel-vs-dc/tree/main/dataset_shdb

@LuisSuarez-pt3rw 3 жыл бұрын

Me gustaría quee ayude sobre una acs en r me puede ayudar

@PabloVallejoMedina 3 жыл бұрын

qué necesitas?

@LuisSuarez-pt3rw 3 жыл бұрын

Te mandaría el algoritmo de R studio y la base de datos para ver dónde estoy equivocado muchas

@PabloVallejoMedina 3 жыл бұрын

@@LuisSuarez-pt3rw mándamela a mi correo: pableres@gmail.com y le echo un vistazo y te digo cuanto costaría el servicio según como esté.

@LuisSuarez-pt3rw 3 жыл бұрын

@AdlerDiaz 2 жыл бұрын

Puedes compartir tu excel por favor, Gracias

@PabloVallejoMedina 2 жыл бұрын

En la descripción está. O si no en el video digo de donde lo saco.

@tziraatmolina9979 2 жыл бұрын

¿Alguien sabe si la variable de "bueno, malo o neutral" se puede visualizar?

@PabloVallejoMedina 2 жыл бұрын

Hola crack, sí si se puede. Pero... qué tipo de visualización?

@winedj8466 3 жыл бұрын

graciaaaas

@PabloVallejoMedina 3 жыл бұрын

De nada ;)

@drsalvadormanrique3118 2 жыл бұрын

jaja, yo creo que OnlyFan es mejor negocio que la ciencia! Gracias por el video. Muy útil.

@PabloVallejoMedina 2 жыл бұрын

No te creas, me abro un OnlyFans y salgo a pagar ;)

@EXXNmmmm 3 жыл бұрын

Lo del ko-fi es una buena idea. Ya el de hoy te lo he pagado.

@PabloVallejoMedina 3 жыл бұрын

ya; pero tu no cuentas ;)

@CesarMolinaMora 2 жыл бұрын

l base de datos no esta git

@PabloVallejoMedina 2 жыл бұрын

Sí, ahí está: github.com/cosmoduende/r-marvel-vs-dc

@Zamihyalina Жыл бұрын

No me funcionó tu video :( pero explicas muy bien

@PabloVallejoMedina Жыл бұрын

mhhh.. qué error te da?

@josereyeslovato 2 жыл бұрын

library(devtools) install_github("vqv/ggbiplot", force = TRUE) Use este comando para instalar el ggbiplot SALUDOS

@PabloVallejoMedina 2 жыл бұрын

Muchas gracias !!!

@jorgegonzalezcampos4434 2 жыл бұрын

Ya no funciona 😕

@PabloVallejoMedina 2 жыл бұрын

@@jorgegonzalezcampos4434 seguro que hay formas