Você já experimentou verificar se no seu conjunto de dados as variáveis estão como *factor* ? Se você estiver usando o pacote tidyverse fica assim library(tidyverse) meus_dados %>% glimpse() Se houver algum dado que esteja usando que não estiver como factor, tente tranformar para factor.
@Victorsantt Жыл бұрын
@@carvalhoribeiro certo! Obrigado
@equipeara17622 жыл бұрын
Não existe residuos padronizados ajustados na ACM? pois olhar para um grafico com 20% de captura de interdependencia, fica quase impossivel afirmar a correlações entre eles
@carvalhoribeiro2 жыл бұрын
Achei excelente o seu questionamento e vou tentar responder em 2 partes 1. Não tem resíduo. Por que ? considerando resíduo a diferença entre previsto e real precisariamos de uma variável de resposta para medir isso e o MCA é uma técnica de aprendizado não supervisionado ou seja, não tem variável de resposta. Logo, não temos o real. 2. Apenas 20% de variância explicada ? Neste exemplo o MCA é usando como análise exploratória (e não inferencial). Geralmente na industria usamos de duas formas. a) Inicial: Onde verificamos se pode existir relação entre as variáveis antes de aprofundar na análise isso pode poupar tempo e dinheiro. b) Complementar: Onde verificamos se existe alguma informação que tenha ficado oculta nas análises de qui quadrado realizadas, oferecendo suporte para pesquisas futuras. 3. Neste exemplo o gráfico diz que pode existir relação, mas falta significancia estatística para afirmar isso categoricamente. Se a recompensa for grande, ele pode mobilizar o time, criar feature engineering*, projeto kaizen e seguir com a análise. Se for baixa, ele pode ficar com os testes qui2 realizados nos testes. ps. Feature engineering: É um variável composta que pode melhorarar o poder de previsão. Imagine que eu experimente jogar apenas adubo numa planta e coleto o resultado. E apenas agua em outra planta e coleto o resultado. A agua e o adubo em experimentos separados pode gerar resultados bem diferentes se eu usar um terceiro experimento juntanto adubo+agua na planta. boa sorte em seus projetos.
@LeBulbasaur Жыл бұрын
@@carvalhoribeiro Bom dia, Professor! Sabe onde consigo encontrar artigos/livros que expliquem melhor esses resultados com gráficos de cerca de 20% da variância explicada? Estou realizado e os resultados que estou obtendo giram sempre em torno disso.
@danielguerrini32483 жыл бұрын
Boa tarde, quando tento fazer as elipses dividindo os grupos, ele diz que o número de active individuals is different from the factor habillage. Estou etendendo que na hora de plotar, o número de active individuals é menor que número de observações originais do meu dataset, pq estou tentando fazer o "grupo" com base em uma das variáveis dele - logo, o número de indivíduos é o mesmo. Você sabe como posso solucionar isso? obrigado.
@carvalhoribeiro3 жыл бұрын
pode ser isso mesmo. Eu fiz outro vídeo que talvez possa ser útil. Neste eu uso a coluna com variável categórica pra fazer o agrupamento kzbin.info/www/bejne/d4W7oKR7qbOnmsk
@barbaradamata57564 жыл бұрын
Não consigo adicionar res.mca para análise. "Warning in install.packages : package ‘res.mca’ is not available (for R version 4.0.2)"
@carvalhoribeiro4 жыл бұрын
É possível que na atualização da versão o pacote não tenha ido junto. Tente instalar estes install.packages("factoextra") install.packages("FactoMineR") #depois library(FactoMineR) library(factoextra)
@ecacarva4 жыл бұрын
Prof. Marcelo, parabéns pelo excelente vídeo. Obrigado pelo material. Tenho um conjunto de dados com 3.000 linhas e 43 variáveis, a análise do qui-quadrado mostrou relacionamentos muito fracos e apenas 2 significantes. Seria uma saída usar este tipo de análise? Outra coisa, fiz um script no R que monta uma espécie de matriz de correlação com base no qui-quadrado e o resultado mostra muitas variáveis preditoras associadas indicando multicolinearidade. Para fazer o MCA é indicado remover estas variáveis antes da análise? Ou seja, quais são os pressupostos aos quais devemos ficar atentos antes de fazer MCA?
@carvalhoribeiro4 жыл бұрын
1. Acredito que o MCA pode ser uma saída mas não espere milagres pois a variancia explicada pode não ser tão grande. Uma ideia seria fazer a tabela de contingencia(qui2) testando a variavel de respostas com as 2 que foram significantes e usar o mapa fatorial MCA pra reforçar a análise. 2. Outro argumento é que considerando as variávels sejam categóricas, não dá pra esperar explicação muito firme de variação quanto se elas fossem contínuas. 3. Se você fez um mapa de correlação, certamente tem variáveis contínuas, quem sabe não seria uma boa analisar elas continuas em um experimento. E em outro, categoriza-las e analisá-las em mapa fatorial. Para extrair e analisar as contínuas tente isso library(tidyverse) library(corrplot) meus_dados %>% select_if(is.numeric) %>% cor() %>% corrplot(type="upper") Obs: Se não tiver os pacotes, instale pois são úteis.
Olá Professor precisava muito da sua ajuda. Dá-me o erro Warning message: ggrepel: 333 unlabeled data points (too many overlaps). Consider increasing max.overlaps . Como posso resolver. Grata pela ajuda
@carvalhoribeiro2 жыл бұрын
Está com muita sobreposição...a sugestão é tentar reduzir os níveis, a quantidade de variáveis ou um pouco dos dois. Se você ajudar o max.overlap pra Inf também pode ter algum efeito. library(FactoMineR) library(factoextra) data(tea) mca_tea
@inorromonibla5 жыл бұрын
obrigado pelas instruções, sabe se pra fazer MCA minhas variaveis precisam estar categóricas? outra pergunta, vc pode disponibilizar o link que vc mensionou da FGV, nao consegui encontrar. valeu
@carvalhoribeiro5 жыл бұрын
Sim para o MCA o ideal é variável categória(qualitativa)...se for "escalar" tipo escala de likert o resultado sai excelente. Se seus dados forem quantitativos vocÊ pode usar o PCA. Quanto ao link da FGV são muitos vídeos...procure por "FGV estatística" vai te dar uma playlist com 20 vídeos pelo menos e são excelentes. Os vídeos de estatística da USP também são muito bons, procure por "Bioestatística USP 2012 " vai retornar os vídeos com Raymundo Azevedo, o cara é fera pra dar aula, pra mim ele é nota 10
@inorromonibla5 жыл бұрын
@@carvalhoribeiro valeu
@thaysmariacostadelucena86663 жыл бұрын
Olá, conheci agora o canal e estou adorando! Estou com uma dúvida. Quando coloco res.mca
@carvalhoribeiro3 жыл бұрын
sim, neste caso você precisa atualizar o pacote "Rcpp" assim install.packages("Rcpp") Feche o RStudio e abra novamente e faça o teste
@thaysmariacostadelucena86663 жыл бұрын
@@carvalhoribeiro obrigada!
@Clarissadf13 жыл бұрын
Olá, muito bom o vídeo! Tentei fazer, porém quando coloco o res.mca
@carvalhoribeiro3 жыл бұрын
pode ser que alguma coluna categórica tenha ficado no seu conjunto. Quanto ao código já está disponível : github.com/factorialmap/analise_pca
@Clarissadf13 жыл бұрын
@@carvalhoribeiro valeu por responder! Achei erro, era uma coluna q estava a mais... Valeu pelo código, parabéns pelo vídeo!
@carvalhoribeiro3 жыл бұрын
@@Clarissadf1 que bom. fico contente que tenha dado certo. Eu fiz um vídeo com código um pouco mais moderno usando tidyverse talvez seja útil kzbin.info/www/bejne/d4W7oKR7qbOnmsk Boa sorte em suas pesquisas.
@igoralves77453 жыл бұрын
@@carvalhoribeiro "Alguma coluna categórica tenha ficado ... não entendi. E já verifiquei se há alguma repetida e não há, me auxilie por favorrrrrrrr
@igoralves77453 жыл бұрын
Excelente aula professor, é bom ter um auxílio quando chegamos em Multivariada Na hora de fazer o res está surgindo um erro: Error in which(unlist(lapply(listModa, is.numeric))) : argument to 'which' is not logical Como faço pra seguir em frente??
@carvalhoribeiro3 жыл бұрын
ele encontrou dados numericos no seu conjunto, como mca é pra dados categóricos ou você precisa alterar de numerico para escalar por exemplo se for o caso (1º, 2º, 3º) ou variável dummy (1,0) no caso de sim ou não, ou então retirar essas variáveis numericas do seu modelo.
@alefybarros24862 жыл бұрын
Não consegui fazer com meus dados, qua do chego em res.mca = MCA (res.mca) Só dá "Erro in 1: row(x) : argument of length 0" Alguém poderia me ajudar? Queria muito conseguir fazer uma MCA com os dados que tenho ToT
@carvalhoribeiro2 жыл бұрын
Em erros como este parece que ele está tentando evocar alguma coisa que não existe dentro do conjunto de dados como por exemplo um nome de uma coluna ou um valor. Só pelo erro fica dificil dianosticar, mas experimente fazer o seguinte. #instalando pacotes install.packages(tidyverse) install.packages(FactoMineR) install.packages(factoextra) #chamando pacotes library(tidyverse) library(FactoMineR) library(factoextra) #chamando dados data("tea") #excluindo variaveis numericas e fazendo o mca tea %>% select(where(is.factor)) %>% FactoMineR::MCA() %>% factoextra::fviz_mca_var() depois de testar isso, altere de "tea" para o seu conjunto de dados e teste novamente.
@leticialopes77464 жыл бұрын
fiquei com uma dúvida.. os grupos precisam ser do mesmo tamanho? pra mim tá dando o seguinte erro Error in data.frame(..., check.names = FALSE) : arguments imply differing number of rows: 0, 27 me ajudou muito o vídeo.. obrigada!
@carvalhoribeiro4 жыл бұрын
Não precisa, basta ter os nomes diferentes pra que ele separe e coloque as cores. Você pode fazer isso também habillage = seu_conjunto_de_dados$coluna_que_voce_quer_mostrar_como_grupo
@leomccready3 жыл бұрын
@@carvalhoribeiro Estava dando erro aqui e vi que o habillage exige um factor, no caso funcionou com "habillage = as.factor(conjunto_dados$coluna_que_quer_mostrar_como_grupo)" Caso alguém mais tenha essa dificuldade. Obrigado pelo vídeo, me ajudou bastante. Abraço.
@jorge36335 жыл бұрын
Está dando esse erro depois do res.MCA
@carvalhoribeiro5 жыл бұрын
Excelente pergunta. Acredito que a resposta está no tipo de variáveis, segue abaixo algumas alternativas 1. Verifique se o dados que você está usando são (qualitativos) ou seja factors no R, este erro está associado a tipo de variáveis e uma possível causa é que poderia estar tentando usar variáveis numéricas(quantitativas), se tiver, tente excluir do conjunto e repita o experimento. 2. Verifique se sua tabela tem o nome "pdca" , caso não tenha, troque o nome pdca aí na função pelo nome do seu conjunto de dados. Complemento Para saber mais sobre tipos de variáveis eu fiz um vídeo chamado "Estatística - Trocando em miúdos o que é estatística e variáveis", vou colocar a tabela como post pra usar quando quiser.
@giseletupinamba33475 жыл бұрын
Poderia passar o script, por favor? Não é possível checar no vídeo. Tks
@carvalhoribeiro5 жыл бұрын
Poxa eu não tenho mais, mas dentro do pacote tem um conjunto de dados chamado poison que é referente a uma pesquisa com crianças de colegial que apresentaram intoxicação alimentar e alguns sintomas. Vou fazer uma análise desse conjunto e salvo no github e te mando o link aqui
@giseletupinamba33475 жыл бұрын
@@carvalhoribeiro super obrigada! Vou checar o pacote tb.