Suas aulas deveriam ser classificadas com "utilidade pública". Muito obrigado, Fernanda!
@dantaslacerda84353 жыл бұрын
A qualidade da aula é sensacional
@FernandaPeres3 жыл бұрын
Ahhh, muito obrigada!! 🥰
@ianeckeli3 жыл бұрын
Ótimo conteúdo!! Está ajudando MUITO no entendimento desta área, e a didática impecável!
@NiltonPereiradosSantos Жыл бұрын
Fernanda, você é fenomenal, viu? Que didática incrível! Parabéns!!!! Vou usar um modelo parecido na minha tese, mas na área de Economia. Mesmo sendo diferente, a ideia básica do funcionamento é parecida. Sucesso pra você, viu?
@cleideportugal296410 ай бұрын
E se houver esse desbalanceamento nas categorias da variável dependente como proceder?
@julianafernandes57763 жыл бұрын
Você está me dando gás para estudar! Muito obrigada pelos seus vídeos. Pensei que faria um teste e já identifiquei que precisarei fazer outro! Muitíssimo obrigada! Uma felicidade nessa pandemia foi ter te encontrado! :)
@FernandaPeres3 жыл бұрын
Que ótimo ouvir isso!!! Obrigada! Boa sorte com as suas análises ❤️
@Uellwar3 жыл бұрын
Em relação ao problema de inflação de zeros (citado aqui 8:44) o modelo conjunto binomial com poisson gamma mostra resultados de avaliação muito bons Conteúdo do vídeo nota 1000 👏🏽🙏🏼
@augustofilho4220 Жыл бұрын
..... de fato são super explicações.... bom trabalho.
@allanbatista11462 жыл бұрын
Fernanda, parabéns! Você acaba de ganhar um seguidor e um admirador. Muito bom o conteúdo!
@goodmorningamazon72363 жыл бұрын
Olá, parabéns ppt mais um vídeo. Muito didático. Aprendo muito. Por favor, faça algins videos sobre multivariada. Preciso muito.
@nutricaocomreferencia3 жыл бұрын
Fernanda! Parabéns! Sua didática continua fantástica!!!! Sugestão para aumentar SUBSTANCIALMENTE as visitas em seu canal: dados em painel no R. O que acha?? Um abraço!!
@oclidiofranciscotete84962 жыл бұрын
Obrigado pela belissima aula. Parabens
@marianacardoso25955 ай бұрын
MUITO OBRIGADA, FEEEE
@fabianeleticia91912 жыл бұрын
Oi Fernanda, muito obrigada!! Pensa em algum dia fazer um vídeo sobre propensity score matching?
@priscilaaraujomelo80353 жыл бұрын
Parabénsssssss! Muito esclarecedor e de alto nível! Showwww!
@FernandaPeres3 жыл бұрын
Obrigada!! ❤️
@izabelleviana17654 ай бұрын
Excelente!
@caduguimaraes3 жыл бұрын
mais uma vez, excelente! Obrigado.
@fabianomcs Жыл бұрын
Mais uma aula show! Parabéns!
@Michael-sr6lx3 жыл бұрын
Suas aulas são fantásticas!
@igneciojoseadriano5756 Жыл бұрын
Excelente explicação
@andreluispawlak94312 жыл бұрын
Parabéns pelo conteúdo... excelente... Quando eu tenho um banco desbalanceado por exemplo 20.000 Não e 1.300 sim teria alguma sugestão de como prosseguir?
@thalles4292 жыл бұрын
Bom ponto!
@paulopi9972 ай бұрын
O uso de boxplots nao ajudam na identificação de outliers nesmo que os resíduos padroes fiquem dentro de -3 a +3?
@felipesantospacheco9652 Жыл бұрын
Oi, Fernanda. Parabéns pelo conteúdo, que é muito didático. Tenho uma dúvida: na hora de verificar os resíduos padronizados para uma regressão que estou rodando, todos os valores ficaram bem distantes de -3 ou +3, sempre próximos de zero, mas o resíduo máximo chegou a quase 4 (3,76). É um problema? Em que isso implica na minha análise?
@ReizinhoDaColina2 жыл бұрын
Parabéns pelo vídeo!
@alicebeatrizpenamedina54262 жыл бұрын
Muito bom suas aulas!,. Uma pergunta, se o modelo de regressão logística seja binomial ou multinomial ocorrer interacao entre as variaveis independentes, qual seria o caminho do script? Se ocorrer que as variaveis independentes ou explicativas sejam quantitativa continua e a outra quantitativa discreta para uma variavel binaria e outra multinomial, seria o mesmo principio explixado tanto da regressão logística binomial e a regressão logística multinomial ?
9 ай бұрын
Parabéns pelos vídeos, tenho aprendido muito no seu canal. Você poderia me tirar uma dúvida? No caso de regressão logística binária, faz sentido falar em residuos? Eu fiquei pensando o seguinte: Se o output Y chapeu é uma variavel categorica binária, tipo SIM ou NÃO, o que seria o residuo vai ser a diferença entre o quê? Em uma OLS, faz sentido falar entre diferença entre valor real e valor esperado, mas na regressão logistica não sei como definir isso, já que a saida é uma variavel categorica.
@FernandaPeres9 ай бұрын
Faz sentido, sim. Há mais de um tipo de resíduo, mas o "raw residual", que é o que a gente geralmente vezes analisa, é a diferença entre o valor observado (sendo considerado 1 ou 0) e a probabilidade prevista pelo modelo. O desfecho é categórico, mas o modelo está calculando a probabilidade de cada sujeito pertencer à categoria 1. Nesse link tem uma explicação com detalhes, e com códigos em R: library.virginia.edu/data/articles/understanding-deviance-residuals)
@guilhermearcoverde47763 жыл бұрын
Parabéns pelo ótimo trabalho! 👏🏼👏🏼👏🏼👏🏼
@FernandaPeres3 жыл бұрын
Obrigada!! 😊
@datahoffmann3 жыл бұрын
Anoto todas suas explicações no script que baixei para acompanhar a rotina.
@FernandaPeres3 жыл бұрын
Ahh, que legal! Acho que esse sistema funciona bem 🥰
@luan-hn8mu6 ай бұрын
quando eu fiz a analise do residuo padronizado, minhas observações estão fora da faixa de intervalo -3 até 3. Esta em -4. Eu devo excluir essas observações do modelo? Obrigada!!!
@paulopi9975 ай бұрын
Deve ser mais de uma variável independente no modelo ou pode ser somente uma? Parabéns pelo conteúdo!! Vc é demais!!
@FernandaPeres5 ай бұрын
Pode ser uma só, sim. Obrigada!
@paulopi9975 ай бұрын
@@FernandaPeresque legal!! Muito obrigado!!!
@thaisdbf Жыл бұрын
Oi Fernanda! Primeiro, obrigada pelos vídeos, você está me salvando desde o meu mestrado hahaha Gostaria de tirar uma dúvida, por gentileza: em 16:55, há problema se os resíduos ultrapassam o min e o max de -3 até +3? No meu caso meus resíduos estão variando entre min -1.953932 e max 6.299312. Quando eu rodo o plot(mod, which = 5) parece estar tudo ok, nenhum ponto se aproxima ou ultrapassa a linha pontilhada de 0,5. Minha variável dependente é dicotômica e meu modelo tem outras 7 variáveis independentes categóricas.
@FernandaPeres Жыл бұрын
Olha, em tese, tudo bem. Mas eu olharia com atenção os outros gráficos de resíduos, porque com essa variação, não parece que os resíduos têm média zero e, muito provavelmente, não são homocedásticos.
@grazielealvesfagundesdossa99673 жыл бұрын
Top! Parabéns Fer!!
@jorge36337 ай бұрын
16:50 meus dados deram min: -3,4 max:1.16. já é um problema?
@alexiasiqueira7521 Жыл бұрын
Como proceder quando ao checar se há outliers, ele estiver fora da regra -3 +3??
@kaioalbarado32732 жыл бұрын
Seus videos estão me ajudando mto. Valeu Fê. Mas nao consigo visualizar a função glimpse. O que faço?
@FernandaPeres2 жыл бұрын
Se você não está conseguindo usar o glimpse, é porque o pacote dplyr não está carregado. Recomendo assistir aos primeiros vídeos da playlist de R, que explica com mais detalhes instalação e carregamento de pacotes ;)
@gabrielmouta27962 жыл бұрын
Meus parabéns pela aula, Fernanda! O que fazer se o pressuposto do Box-Tidwell não for atendido? Retira a variável? Seria a idade da pessoa
@ricardocesar4621 Жыл бұрын
Por sinal, a parte de fazer e interpretar este teste foi cortada? Na parte 2 também nao mostra... Fernanda, seu conteúdo é excelente
@victoriafabris3 жыл бұрын
Fernanda, fico muito feliz de ter encontrado suas aulas sobre esse tema específico aqui no KZbin! Além disso, com tanta qualidade! Uma dúvida: quando você utiliza a função pairs.panels() para visualizar as correlações , o que são os gráficos com figuras ovais? São uma outra forma de visualizar ascorrelações? Parabéns pelos vídeos e muito obrigada!
@FernandaPeres3 жыл бұрын
Oi, Victória, muito obrigada! ❤️ Sim, são elipses de correlação!
@paulomauriciodealencastrog794 Жыл бұрын
Tive problema com a importação de caráteres latinos "não". Usei dados
@fernandapaularocha72663 жыл бұрын
Excelente aula, Fernanda. Fiquei com uma dúvida em relação a essa mudança quando se trata de regressão logística. Ao realizar esse procedimento, "simplesmente" aplicamos a função glm do pacote ISLR e pronto? Pergunto porque estou estudando pelo livro do Trevor Hastie e os bancos de dados utilizados já estão prontos para realizar a aplicação. No caso, por exemplo, se eu tiver n cidades com o número de assassinatos por mês entre os anos de 2014 a 2015, tenho que categorizar explicando pro R codificando a variável cidade e as datas? E se sim, será de forma semelhante a feita no vídeo? Desde já, muito obrigada!
@ecacarva3 жыл бұрын
Ótima aula Fernanda ! O que fazer quando no comando: summary(stdres(modelo)) forem apresentados valores acima de +3 ou abaixo de -3 ?
@FernandaPeres3 жыл бұрын
Isso seria um indício de que há outliers. Esses outliers podem ou não ser um problema para o modelo (enviesando os coeficientes, por exemplo). Não há um consenso, mas uma das principais sugestões é estimar o modelo com e sem os valores outliers e comparar os coeficientes. O gráfico dos resíduos x alavancagem também é excelente para avaliar se esses pontos discrepantes estão impactando a estimação dos coeficientes.
@alexandrecampos27652 жыл бұрын
Ótimo conteúdo. Só uma dúvida pontual: na linha 46 você o utiliza o nome da variável sem a necessidade de acrescentar o no me do banco + $. Mas antes vc não fez um pipe (%>%). No meu arquivo eu precisei informar o banco. O que eu perdi?
@alexandrecampos27652 жыл бұрын
Já entendi. Vc colocou ao final da expressão. Obrigado.
@FernandaPeres2 жыл бұрын
@@alexandrecampos2765 Isso, eu declarei data = dados, por isso que não deu problema no meu.
@heitorcarvalho16283 жыл бұрын
Muito boa aula Fernanda Peres, parabéns! Queria saber uma informação e, talvez, até fazer um pedido. No caso da regressão logística politômica (multinomial), os passos apresentados no seu video são os mesmos? Se não o são, em projeto futuros no youyube, você poderia fazer um tutorial com esse tema? Desde já agradeço!
@FernandaPeres2 жыл бұрын
Quase um ano depois, mas fiz recentemente, rs
@opengisog3 жыл бұрын
Olá, Fernanda, parabéns pelos seus vídeos. São de suma importância para a comunidade. Eu tenho uma dúvida: quando a minha variável independente é nominal e possui mais de uma categoria e meus outputs ocorrem em todas elas, ou seja, não há uma variável de referência, já que todas de alguma maneira tem registro de ocorrência, como devo tratar? Um exemplo mais prático: quero estimar a ocorrência de deslizamento (variável dependente) de terra e dentre as variáveis tenho "solos" (variável independente categórica) que possui vários tipos de solos (cat 1, 2, 3, 4, n) e em cada tipo ocorrem deslizamentos em mais ou menos intensidade, ou seja, não é binária. Como esse dado entraria no meu modelo, considerando a questão da referência? Obrigado!
@fernandoaloisiohm Жыл бұрын
Professora, tem alguma indicação para o caso de amostra muito desbalanceada? Tenho um banco de dados cujo desfecho = 0 corresponde a 90% das observações. Com efeito, o modelo padrão é muito bom para classificar corretamente desfecho = 0, mas horrível para classificar corretamente desfecho = 1. Como o fenômeno que estou analisando é o desfecho = 1, mesmo com acurária overall de 90%, esse modelo é inútil. Visando resolver a questão, usei a função weight para dar peso 1 às obs com desfecho=0 e 9 para obs com desfecho = 1. Ocorreu, porém, que a hipótese do teste HL foi rejeitada (antes, sem atribuição de pesos, não era rejeitada). Já verifiquei os VIF, não há nada que comprometa a estimação. Sabe indicar alguma outra abordagem para lidar com amostra desbalanceada? Melhor que isso, tem algum vídeo teu tratando do assunto?
@FernandaPeres Жыл бұрын
Não tenho vídeo sobre isso, mas dê uma olhada em undersampling e oversampling.
@fernandoaloisiohm Жыл бұрын
@@FernandaPeres mais uma vez, obrigado
@nayara_magry Жыл бұрын
Obrigado pelo vídeo. Eu preciso fazer um modelo de regressão logística binária no R com duas variáveis dependentes categórica com apenas duas categorias (variável dicotômica). É possível?
@FernandaPeres Жыл бұрын
O modelo de regressão logística binária só aceita uma variável dependente. Não sei qual modelo funcionaria para duas variáveis dependentes dicotômicas...
@renantheodoro10973 жыл бұрын
Oi, tudo bem? Você sabe se passo 5, o teste "Box-Tidwell" também se aplica se as VI forem de contagem?
@arielefarias62962 жыл бұрын
voce tem o relatório desse material ?
@FernandaPeres2 жыл бұрын
O script está na descrição do vídeo.
@julianafernandes57763 жыл бұрын
Fernanda, boa tarde! O balanceamento (quando tenho um banco de dados onde uma das respostas representa 75% das observações) é necessário, mesmo que não vá gerar treino e teste? Quero apenas entender variáveis preditoras em um caso específico. Muito obrigada!
@emersongaldino73663 жыл бұрын
Mto obrigado! Regressão Logística Multinomial no R, por favor... rsrsrsrs
@FernandaPeres3 жыл бұрын
Ainda vai sair, rs. Só ajustando o script.
@HumbertoManeto3 жыл бұрын
Se todas as variáveis independentes forem categóricas, é tranquilo fazer regressão logistica binária?
@FernandaPeres3 жыл бұрын
Sim, isso não é um problema para esse modelo
@joaopedrorochadasilva31012 жыл бұрын
Olá, Fernanda! Executei o comando summary(stdres(mod)) em meu modelo, no caso repliquei todos seus ensinamentos mas em um banco de dados próprio para praticar e a seguinte informação aparece: Min. 1st Qu. Median Mean 3rd Qu. Max. -Inf -0.000083 -0.000069 -Inf -0.000069 3.585686 -Inf no mínimo e -inf na média. Apesar que todas as minhas variáveis tanto dependente quanto independentes são categoricas. Esse tipo de informação tira a efetividade da estimação?
@Epassos013 жыл бұрын
Fernanda, excelente trabalho! Essa semana enviei um convite pelo Linkedin. Gostaria de fazer uma consulta comercial. Por gentileza me retorne quando puder. Abraço.
@FernandaPeres3 жыл бұрын
Oi, Ederson, você poderia me enviar um e-mail? Prefiro tratar assuntos de consultorias ou aulas particulares por lá. Muito obrigada! fernandafperes@hotmail.com
@gugapilar75483 жыл бұрын
Muito bom seu video! Lhe desejo muita sorte com o seu canal! Continue postando os videos! Obs.: Não quero lhe incomodar, mas se tiver um tempo para ir no meu canal e dar um feedback sobre meus vídeos (#gugapilar), agradeceria muito! Um abraço e fique bem! 🙏🏼