Gratidão, por compartilhares aqui de uma forma simples esse conteúdo tão importante.
@carvalhoribeiro Жыл бұрын
Fico feliz que o conteúdo tenha sido util
@elisiacorrea255 Жыл бұрын
Muito@@carvalhoribeiro só tenho uma dúvida, como faço para adionar ao gráfico mais um CP. No meu caso os dois primeiros representaram apenas 57% da variância.
@carvalhoribeiro Жыл бұрын
Eu fiz um vídeo sobre PCA em modelos e nessa parte talvez resolva seu problema eu filtrei apenas 2 componentes mas você pode filtrar 3 ou mais kzbin.info/www/bejne/gqLNpqGDoNyAnJI
@carolmeduna72275 жыл бұрын
Consegui resolver o que precisava de forma muito rápida. Obrigada!
@carvalhoribeiro5 жыл бұрын
Que bom Carol parabéns
@murilosilveirayoutube2 жыл бұрын
Obrigado pelo conteúdo!
@carvalhoribeiro2 жыл бұрын
Muito obrigado. Fico feliz que o conteúdo tenha sido útil pra você. Se tiver alguma dúvida não exite em deixar nos comentários ou procurar na playlist PCA onde fiz mostro como explorar resultados, como interpretar resultados e onde tiro dúvida sobre montar os gráficos.
@ACDC95 Жыл бұрын
Obrigada pelo conteúdo ! Onde acho o vídeo do Leandro souto?
@carvalhoribeiro Жыл бұрын
Aula PCA simplificada o nome do vídeo e o canal é Ecologia Descomplicada
@douglasrodrigues4454 жыл бұрын
Aula incrível!!!!
@carvalhoribeiro4 жыл бұрын
obrigado e parabéns pelo trabalho sobre diversidade e abundância de taliáceos
@guguactiongames2 жыл бұрын
Ótima explicação. Seria possível disponibilizar os códigos utilizados para download? Grato.
@carvalhoribeiro2 жыл бұрын
Esse vídeo é antigo acho que está no github, mas hoje fiz um vídeo novo sobre gráfico não falei sobre PCA nele, mas incluí no blog pra você. é o ultimo gráfico lá.
@cookingathomeinbahia4 жыл бұрын
Olá, boa noite. Estava com dificuldade em fazer a análise através das outras formas que o R da. Consegui fazer rapidinho usando esses pacotes e saiu ótima. Obrigada ❤️😊
@carvalhoribeiro4 жыл бұрын
Que bom que foi útil pra você ! Obrigado e boa sorte.
@leonardomorais58475 жыл бұрын
Obrigado irmão.
@carvalhoribeiro5 жыл бұрын
Valeu Leonardo
@claudiusbeaupre2 жыл бұрын
Olá Marcelo, Excelente material. Contudo, quando digito o comando
@carvalhoribeiro2 жыл бұрын
não sei dizer ao certo mas tente grupo
@teodosiosantos1134 Жыл бұрын
Prof Leandro Souto é da minha Universidade e eu não sabia kkkk
@teodosiosantos1134 Жыл бұрын
0:45
@carvalhoribeiro Жыл бұрын
Ele ensina muito bem. Faz as coisas terem sentido também para aqueles que não tem tanta habilidade com a estatística, ainda. Parabéns por tê-lo como professor e aproveite para aprender o máximo que puder.
@teodosiosantos1134 Жыл бұрын
@@carvalhoribeiro Sim, acabei de assistir a um vídeo dele e realmente ele explica muito bem. Infelizmente ele não pertence ao meu departamento ( q é economia).
@WICTORIADELIMAARAUJO11 ай бұрын
Boa noite! Espero que esteja bem. Como posso fazer para mudar a fonte das variáveis dentro do gráfico?
@carvalhoribeiro11 ай бұрын
Aqui neste site você vai achar ...está em inglês mas você consegue traduzir pelo seu navegador: A função usadata é *theme(text = element_text(size = 20))* mas tem vários elementos que você consegue alterar. statisticsglobe.com/change-font-size-of-ggplot2-plot-in-r-axis-text-main-title-legend
@WICTORIADELIMAARAUJO10 ай бұрын
@@carvalhoribeiro Na verdade preciso alterar a fonte dos rótulos das variáveis para 'Times New Roman', dei uma olhadinha no site que me recomendou, mas não encontrei uma solução. Pode me ajudar? Desde já agradeço pelo conteúdo e atenção.
@MuriloLeal06 Жыл бұрын
Desculpa incomodar novamente, rodei uma analise de pca, e gostaria de copiar os dados da variação dos genótipos em cada componente entretanto o Rstudio limita a um numero maixmo de observações que aparecem no console, e aparece a seguinte mensagem [ reached getOption("max.print") -- omitted 124 rows ] Como faço para para aparecer o restante das observações, pois preciso copia-las.
@carvalhoribeiro Жыл бұрын
use este comando antes de gerar o resultado da sua PCA e veja se dá certo. *options(max.print = 10000)* exemplo de uso se tiver o pacote modeldata instalado, vou usar o conjunto cell_segmentation data(cells, package = "modeldata") options(max.print = 10000) cells |> select_if(is.numeric) |> scale() |> prcomp()
@RafaelFortes_2 жыл бұрын
Professor Carvalho, boa noite. Teria algum vídeo do Sr. onde tenha exemplo de como realizar a seleção das dimensões no dataset do espaço da PCA? Consigo criar uma visualização em Clusters dos dois primeiros componentes principais? Como ?
@carvalhoribeiro2 жыл бұрын
Acho que fiz alguma coisa nesse sentido...usando tidymodels e o vídeo está aqui kzbin.info/www/bejne/eJ7Ic3yNjJmZqas vai estar em 22:40
@fernandatorres60023 жыл бұрын
Olá marcelo! parabens pelo video, como faço para alterar a escala de cor das bolinhas?
@carvalhoribeiro3 жыл бұрын
tem várias formas de fazer vou passar duas que você vai colocar na linha debaixo do seu código. #manual scale_fill_manual(values = c("grey30", "red", "lightblue")) # ou usando o gradiente brewer com cores amigáveis para daltonicos scale_fill_brewer(palette = "BrBG")
@MuriloLeal06 Жыл бұрын
Olá, deixa eu tirar mais uma duvida. É possível fazer analise de componentes principais com dados qualitativos. Por exemplo, cor da folha, formato de folha, e outros parâmetros que estão em escala de notas? Caso não seja possível que outra análise posso fazer com dados categóricos?
@carvalhoribeiro Жыл бұрын
PCA com dado categórico não é possível. Com essa informação em mãos você tem algumas alternativas. a) Transformar seus dados categoricos ou escalares em dummy variables e fazer a PCA depois da transformação. b) Usar os dados categóricos sem transformação usando MCA (Análise de correspondência multipla) eu fiz um vídeo sobre a técnica: kzbin.info/www/bejne/iHXIqXt7aq6kqMksi=NKBJRqXkYAVU_Trz
@WICTORIADELIMAARAUJO Жыл бұрын
Excelente aula professor, me ajudou bastante. Uma dúvida apenas, tem como eu selecionar por exemplo, duas variáveis e deixá-las na cor vermelha e o restante na cor preta?
@carvalhoribeiro Жыл бұрын
Mudar a cor de uma variável manualmente eu não conheço, uma alternativa poderia ser mudar a cor pela importancia da variável na pca via argumento *col var = contrib* ou usar o annotate do ggplot2 inserindo as coordenadas das suas variáveis nos limites x e y, segue abaixo um exemplo library(tidyverse) library(factoextra) iris |> select(-Species) |> prcomp() |> fviz_pca_biplot(geom.ind = "point", col.var = "contrib", gradient.cols = c("black","red"))+ annotate("rect", xmin = 1.2, xmax = 3.4, ymin = -1.01, ymax = -.85, alpha = 0.2, color = "red", fill = "red")
@franbraga434 Жыл бұрын
mto obrigada pelo vídeo. Voce teria o script utilizado disponívell em algum local?
@carvalhoribeiro Жыл бұрын
Fico feliz que o conteúdo tenha sido util, eu fiz alguns vídeos posteriormente com códigos mais modernos. Mas o código e a planilha deste, estão disponíveis no github: github.com/factorialmap/pca_componentes_principais
@AndersonAlves0308 Жыл бұрын
Oi, boa tarde, estou desenvolvendo um trabalho em cima do que você explica aqui, como posso obter este dataset que você usou?
@carvalhoribeiro Жыл бұрын
Eu deixei no github e você pode acessar aqui github.com/factorialmap/pca_componentes_principais
@AndersonAlves0308 Жыл бұрын
@@carvalhoribeiro muito obrigado. Consegui pegar.
@carvalhoribeiro Жыл бұрын
excelente
@brunabarbosa4897 Жыл бұрын
Como eu tiro os nomeros das amostras no biplot e deixo apenas os ícones ficando grandes ou pequenos de acordo com os valores?
@carvalhoribeiro Жыл бұрын
Para tirar os números das amostras use *geom.ind = "point"* e para ajustar o tamanho do ponto com base no valor acho que fica redundante pois como o PCA é um gráfico de coordenadas, os pontos com menor valor de contribuição por exemplo, ficam próximos ao centro. Mas você pode ajustar tanto pelo tamanho quando pela cor como eu mostro abaixo. library(tidyverse) library(factoextra) iris %>% select(-Species) %>% prcomp(center = TRUE, scale. = TRUE) %>% fviz_pca_biplot(geom.ind = "point", pointsize = "contrib", #efeito redundante col.ind = "contrib") Também fiz um vídeo sobre como ajustar em cores diferentes kzbin.info/www/bejne/d4W7oKR7qbOnmsksi=N7xMWYueeVGBxmYl Espero que tenha ajudado
@brunabarbosa4897 Жыл бұрын
@@carvalhoribeiro obrigada!
@claudiusbeaupre2 жыл бұрын
É possivel realizar essa metodologia caso uma das coletas fosse perdida? Ou seja em um ensaio desbalanceado onde o número de repetições é diferente podemos proceder esta análise?
@carvalhoribeiro2 жыл бұрын
Se for pra análise exploratória não vejo problema, mas se for saltar para inferencial aí vale uma consulta na literatura para confirmar.
@MuriloLeal06 Жыл бұрын
Olá novamente, seria possivel realizar um gráfico com três dimensões utilizando 3 componentes principais? Se sim qual pacote do rstudio seria possivel de realizar?
@carvalhoribeiro Жыл бұрын
Eu acredito que para 3 tenha gráfico 3D mas eu não uso, quando preciso fazer com mais dimensões eu uso um gráfico de barras. Neste vídeo no final eu explico como inserir mais dimensõesm, lá onde está 1:2 tente colocar 1:3 ou mais se precisar: kzbin.info/www/bejne/eJ7Ic3yNjJmZqassi=nOxKtZEXVuYUoQYp
@MuriloLeal06 Жыл бұрын
@@carvalhoribeiro Como seria esse gráfico de barras? Tenho 235 observações e 9 variáveis, seria possível? Estou querendo utilizar o gráfico com 3 dimensões pois as duas primeiras dimensões não explicaram muito da variação.
@carvalhoribeiro Жыл бұрын
Eu te mandei o link do vídeo o gráfico de barras estão no final.
@MuriloLeal06 Жыл бұрын
@@carvalhoribeiro Opa, muito obrigado. Consegui fazer o grafico tridimensional, utilizei o pacote "rgl", ele é muito bom e simples de usar. Muito obrigado pelas orientações amigo.
@wilsonbotelho3530 Жыл бұрын
Boa noite Professor Carvalho, Estou transferindo a realização das minhas análises multivariadas PCA, HCA e Regressões para o R, mas estou tendo dificuldade no pré-processamento. Os pré-processamentos que costumo realizar são centralização dos dados na média e autoescalonamento, o senhor teria alguma vídeo aula ou material para indicar que fale a respeito destes pré-processamentos no R?
@carvalhoribeiro Жыл бұрын
Vai ser bem tranquilo fazer tanto o PCA quando o pré processamento no R. Eu fiz alguns vídeos sobre PCA uns 5 mais ou menos e você pode pesquisar e certamente vai encontrar o que precisa. Um exemplo é este: kzbin.info/www/bejne/pnTEd2BnjdSKo8U Também pode procurar em outras fontes pelo termo "tidymodels recipes" que ajuda no pré processamento. Um abraço e sucesso em seus projetos
@brenobarros35232 жыл бұрын
Olá, professor Carvalho. ótimo vídeo, muito bem explicativo. o S.r. disponibiliza esse script?
@carvalhoribeiro2 жыл бұрын
Sim, atualmente eu deixo no blog e os mais antigos estão no github. Ambos os links estão na bio. Boa sorte em seus projetos.
@wictoriaaraujo6457 Жыл бұрын
Olá... quando adiciono o código (grupo
@carvalhoribeiro Жыл бұрын
A PCA não aceita variáveis categóricas você precisa retirar...eu tenho uma playlist só de PCA onde tem técnicas mais novas pra você retirar essas variáveis da análise. Uma delas é usando o pacote tidyverse. Fica muito mais simples de fazer.
@Emerson.Franca Жыл бұрын
@@carvalhoribeiro olá, a PCA não aceita variável categórica? Mas na sua coluna 1 (local) é uma variável categórica e mesmo assim você conseguiu fazer o grupo. O que aconteceu? Pergunto pq fui fazer o grupo e deu o mesmo erro acima...
@carvalhoribeiro Жыл бұрын
Ela não é uma coluna.é um rótulo de linha por isso que saiu. Para dados categóricos apenas a *análise de correspondência múltipla* funciona
@Emerson.Franca Жыл бұрын
@@carvalhoribeiro obrigado pelo retorno
@viniciusterra3 жыл бұрын
Boa tarde! Ótimo vídeo! Gostaria de saber como faço pra acessar os valores dos eixos nessa função! Normalmente uso prcomp pra fazer a PCA, quero fazer uma comparação dos valores pra tirar uma dúvida!
@carvalhoribeiro3 жыл бұрын
colocando o nome do objeto dar enter ele vai dar as opções depois é só escolher e colocar o $. Exemplo objeto res_pca eu escolho os resultados por variáveis e quero ver as coordenadas res_pca$var$coord Para comparar com o prcomp é importante notar algumas diferenças e uma delas pode trazer bastante dúvida. O prcomp entrega loadings e o FactoMineR entrega coordenadas. Para calcular os loadings basta pegar as coordenadas das variáveis e dividir pela raiz quadrada dos autovalores de cada dimensão exemplo tente aí: #fazer a pca pca_iris % PCA(quali.sup = 5, graph = FALSE, scale.unit = TRUE) #extrair as coordenadas e autovalores. pca_iris$var$coord pca_iris$eig[1:4,1] #calcular o loadings para comparar com prcomp loading_pca_iris
@fernandamoraes34324 жыл бұрын
Marcelo, por gentileza, poderia me ajudar? Quando vou plotar o gráfico de PCA aparece a seguinte mensagem error in fviz_pca_var(res.pca, col.var = “blue”) could not find function “fviz_pca_var” Até tentei trocar a cor para green mas tbm não funcionou. Muito obrigada.
@carvalhoribeiro4 жыл бұрын
Oi Fernanda verifique se está com o pacote Factoextra carregado, se não tiver carregue library(factoextra).
@fernandamoraes34324 жыл бұрын
Obrigada!! Marcelo, no caso de trabalhar com 2 grupos (2 fatores), qual seria o melhor comando para acrescentar?
@carvalhoribeiro4 жыл бұрын
Eu fiz um vídeo que mostra colorir grupos diferentes kzbin.info/www/bejne/d4W7oKR7qbOnmsk
@ThiagoAlves-kn2tt4 жыл бұрын
Marcelo, como consigo inserir as variáveis nominais (nascente, zona_urbana e zona_rural) no "Gráfico PCA Qualidade da Água"?. Segui todos os passos do vídeo e nesse gráfico não aparecem as variáveis nominais, as que são expressas no gráfico ("Gráfico PCA Qualidade da Água") são referentes aos valores de ph.
@carvalhoribeiro4 жыл бұрын
veja se esse vídeo te ajuda...o código que usei nesse é mais novo e pode facilitar a vida kzbin.info/www/bejne/d4W7oKR7qbOnmsk
@nikerllyamaral30243 жыл бұрын
você usou o comando col.var = "blue" para colorir todas as variáveis, mas elas estão todas de uma única cor...com seria para pedir as variáveis em cores diferentes?
@carvalhoribeiro3 жыл бұрын
Experimente isso fviz_pca_var(res_pca, col.var =c("red","blue","green","gray"))+ theme(legend.position = "none")
@gustavorodrigues26152 жыл бұрын
Ótimo vídeo. Uma dúvida : para a variável dependente, ela pode ter diferentes tamanhos? Por exemplo um local pode ter 5 pontos amostrais e outro local 7 pontos amostrais? Ou o número de pontos deve ser padronizado?
@carvalhoribeiro2 жыл бұрын
1. Em uma PCA não há variável dependente(variável de resposta), se você precisar fazer com variável dependente tente usar o PLS. 2. O ideal é o mesmo número de pontos para todas as variáveis e em nos casos em que essas variáveis possuam unidade de medida diferentes, será necessário transformar em escala
@almeidaberna5 жыл бұрын
Muito obrigada! Esse pacote facilita muito, ainda não o conhecia.
@carvalhoribeiro5 жыл бұрын
Que bom que ajudou
@samilenaianegoncalves34155 жыл бұрын
Há possibilidade de realizar esse teste com variáveis explicativas e a variável resposta? Com a finalidade de reduzir as variáveis explicativas a aquelas que mais explicassem a variável resposta.
@carvalhoribeiro5 жыл бұрын
Olá Samile. Eu não colocaria um variável dependente no PCA pois eu correria o risco de criar uma correlação estranha entre os componentes e a variável dependente. Eu optaria pelo caminho, executar o PCA=> reduzir o número de variáveis=>regredir a variável dependente com os componentes resultantes da PCA ou optaria por outras técnicas como Análise discriminante LDA/NDA ou Classificação quadrática. Se seu objetivo é reduzir as dimensões também existem outros métodos como filtro de baixa variância, taxa de dados faltantes, filtro de alta correlação etc.. Espero ter ajudado
@satoshi_higashikawa4 жыл бұрын
Olá Marcelo, obrigado pelo vídeo! Tenho uma dúvida, como faço para o gráfico ficar com o fundo branco, sem as linhas?
@carvalhoribeiro4 жыл бұрын
Tente esse e depois me fale. 1. No final do código após o parênteses digite + theme_ 2. Vai abrir uma lista de temas. Escolha void(). Ficaria assim + theme_void() ou + theme_pubr() ou + theme_classic()
@satoshi_higashikawa4 жыл бұрын
@@carvalhoribeiro Obrigado, deu certo com o +theme_classic(). É possível deixar o círculo dentro de um quadrado (com linhas nas extremidades)?
@TiaJuci-viajarébom4 жыл бұрын
Marcelo Carvalho dos Anjos...por favor me ajude ...eu estou com muita dificuldade no RStudio, preciso saber como trabalhar com variáveis que não são binárias, são 3 e não estou conseguindo analisar tudo ao mesmo tempo...tem como a gente se falar pelo mensager do facebook, por lá eu posso te mostrar o que eu fiz e qual é o meu problema.
@carvalhoribeiro4 жыл бұрын
Olá, poxa eu não uso redes sociais fechadas mas pode postar sua pergunta no quora.com que eu respondo ou aqui mesmo nos comentários. Uma dica para analisar dados com 3 ou mais respostas, é pesquisar pelo conjunto de dados "iris", esse conjunto de dados tem tres variáveis de resposta "setosa" "verginica" e "versicolor" e é muito popular pois usandos pra vários exemplos ao redor do planeta terra inteiro.
@victornagatani76544 жыл бұрын
Olá, boa tarde! estou com dificuldade no pca_biplot, está dando erro no habillage, aparece a seguinte msg: "Error in .add_ind_groups(X, df, habillage) : The number of active individuals is different from the length of the factor habillage. Please, remove the supplementary individuals in the variable habillage". Sabe o que pode estar havendo? Parabéns pelo vídeo, já ajudou muito!
@carvalhoribeiro4 жыл бұрын
se você tiver a variável categória no conjunto de dados (ou coluna varchar na sua tabela), tente isso: habillage = seu_conjunto_de_dados$coluna_que_voce_quer_mostrar_como_grupo
@andersondias91374 жыл бұрын
Oi, como faço pra ter acesso aos coeficientes? Preciso montar uma equação com a PCA
@carvalhoribeiro4 жыл бұрын
Os loadings não são dados no factominer, mas tente isso substituindo o "res_pca" pelo nome do objeto de pca que você criou. (e.g. se for res_pca pode testar já) sweep(res_pca$var$coord,2,sqrt(res_pca$eig[1:ncol(res_pca$var$coord),1]),FUN="/")
@andersondias91374 жыл бұрын
@@carvalhoribeiro Consegui! Grato!
@nicoMRO942 жыл бұрын
Olá, muito obrigado pelo conteúdo. Informação de primeira mesmo! Quero aproveitar o espaço do comentário pra pedir alguma orientação sobre a plotagem das elipses de confiança: Existe uma forma prática, usando o FactoMineR, de mostrar só um agupamento no gráfico? Quando eu isolo os clusters pro biplot, tem uma seção da coluna que eu gostaria de exibir sozinha pra facilitar a visualização. Consegue me dar uma luz? Agradeço desde já.
@carvalhoribeiro2 жыл бұрын
Se quiser exibir os dados sozinhos minha sugestão é usar um gráfico x y simples e usar função do ggforce por exemplo geom_mark_ellipse. No PCA por regra do método científico, é necessário mostrar os dados, mas se quiser dar enfase para um grupo o meio mais simple pode ser esse library(FactoMineR) library(factoextra) pca_iris
@nicoMRO942 жыл бұрын
@@carvalhoribeiro Excelente solução! Bem prática, muito obrigado. Eu estava tentando criar as ellipses do zero com matrizes de coordenadas e correlação: tab
@murilodauro57265 жыл бұрын
quando vou gerar a PCA ele não gera, diz que "Error in PCA(pecrad.active, graph = F) : could not find function "PCA" saberia me informar o porque?
@carvalhoribeiro5 жыл бұрын
Faça um check nos itens e veja se funciona 1) Se você chamou o pacote factomineR com o comando library(FactoMineR) 2) Se você chamou o pacote e ainda não funcionou, tente instalar novamente o pacote install.package(FactoMineR), depois chame o pacote e tente que vai dar certo. 3) Se não der me avise. Note que eu criei também outro vídeo PCA com apenas 1 linha de código, talvez seja útil também Grande abraço
@murilodauro82395 жыл бұрын
Eu já consegui instalar essas 2 bibliotecas mas ainda assim não consigo gera o PCA
@carvalhoribeiro5 жыл бұрын
Ele dá a mesma mensagem ou outra....certifique se que suas variáveis sejam continuas ou discretas...se no conjunto tiver categoricas ele pode dar erro também
@murilodauro82395 жыл бұрын
@@carvalhoribeiro vou me verificar dos conjuntos, tem algum outro meio para entrar em contato? Que não seja pelos comentários?
@carvalhoribeiro5 жыл бұрын
Isso...o conjunto tem que ser variáveis numéricas. Pode postar no hang out também que eu respondo lá, o interessante de deixar aqui é que quando alguém tiver com o mesmo problema que é bem comum, ele já mata, mas pode postar lá também blz
@MuriloLeal06 Жыл бұрын
Como faço para aparecer o nome da observação ao invés de um numero?
@carvalhoribeiro Жыл бұрын
se o nome for exclusivo ou seja, se ele não tiver repetido no conjunto de dados você pode jogar o nome para nome de coluna assim. library(tidyverse) my_data prcomp() |> factoextra::fviz_pca_biplot()
@carvalhoribeiro Жыл бұрын
eu acho que você tinha enviado um comentário eu acabei apagando sem querer. Se deu certo blz..se não deu manda novamente
@jorgemarcospenichebarbosa79214 жыл бұрын
Boa noite, Marcelo. Estou tendo problema na hora de gerar o grafico biplot, estou colando o script dessa forma, fviz_pca_biplot(res.pca,habillage=grupo,title="PCA mineralogia"), e esta aparecendo o Erro: Unknown colour name: c("BR1", "BR2", "AC1", "AC2", "SIR1", "SIR2", "CB1", "CB2", "SC1", "SC2", "PAR1", "PAR2", "CN1", "CN2", "FLP1", "FLP2"). Por favor me ajude. como posso corrigir esse erro? Desde já agradeço.
@carvalhoribeiro4 жыл бұрын
Talves trocar o colour para green por exemplo no lugar desses outros nomes. Eu fiz um outro vídeo com dúvidas que talvez possa ser util kzbin.info/www/bejne/d4W7oKR7qbOnmsk. Veja e depois me avise se deu certo
@leslemos4 жыл бұрын
Estou ha dias tentando fazer um PCA e nao consigo, depois de ver seu video foi a primeira vez que consegui fazer! Muito obrigada!!!! Mas, eu estou tendo problema com o habillage, assim como a pessoa aqui em cima.
@carvalhoribeiro4 жыл бұрын
tente tirar o habillage vai funcionar. Se tiver muitos grupos uma boa opção seria alterar as cores dos grupos, eu fiz um outro vídeo que talvez seja útil kzbin.info/www/bejne/d4W7oKR7qbOnmsk
@beatrizguzzo4 жыл бұрын
Olá, na hora do comando head só me aparecem 6 linhas mas tenho 30 para fazer a análise, não funciona mesmo limitando as linhas a 30, sempre o r mostra somente 6... O que devo fazer?
@carvalhoribeiro4 жыл бұрын
Copie isso pra dentro do seu R #Vou usar o conjunto de dado iris, mas pode substituir pelo seu conjunto data(iris) # Dica 1 coloque a quantidade que você quer de linhas na frente do head, isso é como se numa panela de sopa você olhasse para um ponto e tirasse uma colher cheia de dentro como amostra head(iris,20) # Dica 2 usando tidyverse e fazendo amostra aleatória dos dados. Neste caso, na frente da sua panela de sopa, você está fechando o olho e extraindo uma amostra aleatória library(tidyverse) sample_n(iris, 20) #Dica 3 use o comando View(iris). Neste caso você já está pegando toda a sopa e organizando nos pratos, fica como uma tabela do excel. View(iris) Espero ter ajudado
@beatrizguzzo4 жыл бұрын
@@carvalhoribeiro Coloquei head(dados_tcc.active,30) e funcionou... Obg! Agora pra rodar o PCA está dando outro erro e não sei o que pode ser, sou leiga nessas análises no R e estou seguindo pelo seu vídeo, rs Coloquei o comando res.pca
@carvalhoribeiro4 жыл бұрын
@@beatrizguzzo Analise de PCA só funciona com dados numéricos, neste caso você pode colocar os categóricos como suplementares assim data(iris) library(FactoMineR) library(factoextra) pca_iris
@beatrizguzzo4 жыл бұрын
@@carvalhoribeiro Estou com uma dificuldade na hora de plotar o gráfico PCA que é o seguinte: no seu exemplo você tem três categorias 'nascente', 'zona_rural' e 'zona_urbana', no meu caso, essa primeira coluna são 30 nomes de cidades diferentes, nenhum deles se repete. Creio eu, que como não se repetem não seja possível realizar agrupamento, não é?! Nesse caso, não sei como seria o agrupamento pra poder representá-las no gráfico, se for possível, ou como posso fazer somente uma distribuição dos municípios entre as duas dimensões para conseguir uma relação dos municípios com os vetores que são indicadores de qualidade desses municípios.
@carvalhoribeiro4 жыл бұрын
Olha, acho que teria que ver o seu objetivo com a análise por que o PCA é feito para identificar os componentes principais responsáveis pelas variações. Se o seu objetivo é agrupar com caractertísticas comuns, acho que o método seria cluster. Qualquer coisa, tente elucidar seu exemplo e posta quora.com que eu acho que fica mais fácil
@rezendevivian67715 жыл бұрын
Foram utilizados os dados brutos pra fazer a análise de pca? Não seria necessário fazer aquela conversão antes não? Parabéns pelo vídeo!
@carvalhoribeiro5 жыл бұрын
Voce tem razao Rezende é sempre necessário transformar pra escala e neste caso específico a função do pacote no R já faz isso automaticamente.
@fabianofranca6745 жыл бұрын
Marcelo, parabéns e obrigado por este tutorial! Você pode me indicar o endereço do referido script no Github, não consegui encontrar aqui. Obrigado!
@carvalhoribeiro5 жыл бұрын
Valeu Fabiano...o endereço do GitHub é github.com/factorialmap/analise_pca
@lucianafoppa67405 жыл бұрын
Ótimo vídeo! Estou com uma dúvida. Quando vou gerar o grupo aparece a seguinte mensagem "Error: Can't use matrix or array for column indexing Call `rlang::last_error()` to see a backtrace" Qual será o erro?
@carvalhoribeiro5 жыл бұрын
Este tipo de erro está relacionado a tipo de variáveis e é bastante genérico ou seja, pode ter como causa diversos fatores. Neste caso eu precisaria de mais dados como tipo de variáveis que você está tentado utilizar, qual a etapa, etc. Como não tenho essa informação, a minha sugestão é verificar se no seu conjunto de dados não existe variáveis "categóricas", se tiver, experimente retirar e rodar o modelo novamente. O PCA é adequado para análise com variáveis quantitativas, para variáveis qualitativas o mais adequado é o MCA. Boa sorte e qualquer coisa é só avisar.
@lucianafoppa67405 жыл бұрын
@@carvalhoribeiro Obrigada pela atenção e pela resposta! Eu tenho uma série de variáveis medidas em mm e os grupos que gostaria de criar são diferentes categorias animais. As análises estavam rodando corretamente, mas quando vou criar os grupos para aparecer no gráfico, aparece aquela mensagem. Se tento sem os grupos, o gráfico parece ok. Mais uma vez, obrigada!
@carvalhoribeiro5 жыл бұрын
uhmmm..já tentou transformar sua variavel em factor ao criar o grupo grupo
@lucianafoppa67405 жыл бұрын
@@carvalhoribeiro Tentei novamente e agora deu certo! Muito obrigada e parabéns pelo trabalho!
@carvalhoribeiro5 жыл бұрын
@@lucianafoppa6740 Que bom fico muito contente que tenha conseguido. Boa sorte em seus estudos
@filipeaiuranamorato1685 жыл бұрын
Olá Marcelo excelente explicação. Como eu altero das legendas das axes? Tipo Dm1 para PCA1. Muito obrigado!
@carvalhoribeiro5 жыл бұрын
Tente isso Felipe fviz_pca_ind(res_pca) + labs(title ="Analise de componentes principais", x = "PCA1", y = "PCA2")
@thrutzs4 жыл бұрын
quando tento rodar o comando fviz_pca_biplot(res.pca, habillage = grupo, title = "Gráfico PCA") ele da o seguinte erro Error in data.frame(..., check.names = FALSE) : arguments imply differing number of rows: 0, 30 como posso ajeitar isso? foi o único erro que deu Valeu pelo vídeo!!!!
@carvalhoribeiro4 жыл бұрын
Aparentemente você está com problema no seu conjunto de dados, certifique-se que todos os dados são numéricos, e que toras as colunas tenha o mesmo comprimento(número de linhas). Acredito que isso dará certo
@Rafael-iv9qw3 жыл бұрын
@@carvalhoribeiro olá, Marcelo, o meu também dá erro ai: > fviz_pca_biplot(res.pca, habillage = grupo, title = "Gráfico PCA") Error in data.frame(..., check.names = FALSE) : arguments imply differing number of rows: 0, 12 Os dados são todos numéricos, as colunas têm o mesmo comprimento. Obg
@carvalhoribeiro3 жыл бұрын
@@Rafael-iv9qw é por causa do habillage = grupo tente tirar que vai dar certo...eu fiz outro vídeo que acredito fique bem mais simples e elegande de apresentar o gráfico veja se ajuda kzbin.info/www/bejne/d4W7oKR7qbOnmsk
@Rafael-iv9qw3 жыл бұрын
@@carvalhoribeiro Marcelo! Muito obrigado, vou dar uma olhada.
@catherineamorim40124 жыл бұрын
Olá, acho excelentes os seus vídeos, sempre me ajudam muito! Só estou com uma dúvida, eu tenho como deixar todos os pontos como "bolinha" e de cor diferente apenas? Sem os símbolos serem diferentes..
@carvalhoribeiro4 жыл бұрын
Veja se este ajuda kzbin.info/www/bejne/d4W7oKR7qbOnmsk
@catherineamorim40124 жыл бұрын
@@carvalhoribeiro ajudou bastante, agora consegui. Muito obrigada! E parabéns pelos seus vídeos!
@carvalhoribeiro4 жыл бұрын
@@catherineamorim4012 Excelente...fico muito contente que tenha dado certo.
@pedroborges60924 жыл бұрын
Alguem pode me ajudar? Quando chega na parte para gera o pca, após eu realizar o comando dar erro dizendo que as variáveis não são quantitativas...alguém saberia me explicar?
@carvalhoribeiro4 жыл бұрын
Para o pca funcionar você precisa certificar que as variáveis são quantitativas(numéricas). Se tiver alguma variável qualitativa(categórica) ou você precisa retirar do conjunto antes de rodar a pca ou colocar ela no argumento que ela é suplementar.