Regressão logística binária no R (Parte 1)

Рет қаралды 23,525

Fernanda Peres

Күн бұрын

Пікірлер: 77

@MichaelFerreiradaSilva 3 жыл бұрын

Suas aulas deveriam ser classificadas com "utilidade pública". Muito obrigado, Fernanda!

@dantaslacerda8435 3 жыл бұрын

A qualidade da aula é sensacional

@FernandaPeres 3 жыл бұрын

Ahhh, muito obrigada!! 🥰

@ianeckeli 3 жыл бұрын

Ótimo conteúdo!! Está ajudando MUITO no entendimento desta área, e a didática impecável!

@NiltonPereiradosSantos Жыл бұрын

Fernanda, você é fenomenal, viu? Que didática incrível! Parabéns!!!! Vou usar um modelo parecido na minha tese, mas na área de Economia. Mesmo sendo diferente, a ideia básica do funcionamento é parecida. Sucesso pra você, viu?

@cleideportugal2964 10 ай бұрын

E se houver esse desbalanceamento nas categorias da variável dependente como proceder?

@julianafernandes5776 3 жыл бұрын

Você está me dando gás para estudar! Muito obrigada pelos seus vídeos. Pensei que faria um teste e já identifiquei que precisarei fazer outro! Muitíssimo obrigada! Uma felicidade nessa pandemia foi ter te encontrado! :)

@FernandaPeres 3 жыл бұрын

Que ótimo ouvir isso!!! Obrigada! Boa sorte com as suas análises ❤️

@Uellwar 3 жыл бұрын

Em relação ao problema de inflação de zeros (citado aqui 8:44) o modelo conjunto binomial com poisson gamma mostra resultados de avaliação muito bons Conteúdo do vídeo nota 1000 👏🏽🙏🏼

@augustofilho4220 Жыл бұрын

..... de fato são super explicações.... bom trabalho.

@allanbatista1146 2 жыл бұрын

Fernanda, parabéns! Você acaba de ganhar um seguidor e um admirador. Muito bom o conteúdo!

@goodmorningamazon7236 3 жыл бұрын

Olá, parabéns ppt mais um vídeo. Muito didático. Aprendo muito. Por favor, faça algins videos sobre multivariada. Preciso muito.

@nutricaocomreferencia 3 жыл бұрын

Fernanda! Parabéns! Sua didática continua fantástica!!!! Sugestão para aumentar SUBSTANCIALMENTE as visitas em seu canal: dados em painel no R. O que acha?? Um abraço!!

@oclidiofranciscotete8496 2 жыл бұрын

Obrigado pela belissima aula. Parabens

@marianacardoso2595 5 ай бұрын

MUITO OBRIGADA, FEEEE

@fabianeleticia9191 2 жыл бұрын

Oi Fernanda, muito obrigada!! Pensa em algum dia fazer um vídeo sobre propensity score matching?

@priscilaaraujomelo8035 3 жыл бұрын

Parabénsssssss! Muito esclarecedor e de alto nível! Showwww!

@FernandaPeres 3 жыл бұрын

Obrigada!! ❤️

@izabelleviana1765 4 ай бұрын

Excelente!

@caduguimaraes 3 жыл бұрын

mais uma vez, excelente! Obrigado.

@fabianomcs Жыл бұрын

Mais uma aula show! Parabéns!

@Michael-sr6lx 3 жыл бұрын

Suas aulas são fantásticas!

@igneciojoseadriano5756 Жыл бұрын

Excelente explicação

@andreluispawlak9431 2 жыл бұрын

Parabéns pelo conteúdo... excelente... Quando eu tenho um banco desbalanceado por exemplo 20.000 Não e 1.300 sim teria alguma sugestão de como prosseguir?

@thalles429 2 жыл бұрын

Bom ponto!

@paulopi997 2 ай бұрын

O uso de boxplots nao ajudam na identificação de outliers nesmo que os resíduos padroes fiquem dentro de -3 a +3?

@felipesantospacheco9652 Жыл бұрын

Oi, Fernanda. Parabéns pelo conteúdo, que é muito didático. Tenho uma dúvida: na hora de verificar os resíduos padronizados para uma regressão que estou rodando, todos os valores ficaram bem distantes de -3 ou +3, sempre próximos de zero, mas o resíduo máximo chegou a quase 4 (3,76). É um problema? Em que isso implica na minha análise?

@ReizinhoDaColina 2 жыл бұрын

Parabéns pelo vídeo!

@alicebeatrizpenamedina5426 2 жыл бұрын

Muito bom suas aulas!,. Uma pergunta, se o modelo de regressão logística seja binomial ou multinomial ocorrer interacao entre as variaveis independentes, qual seria o caminho do script? Se ocorrer que as variaveis independentes ou explicativas sejam quantitativa continua e a outra quantitativa discreta para uma variavel binaria e outra multinomial, seria o mesmo principio explixado tanto da regressão logística binomial e a regressão logística multinomial ?

9 ай бұрын

Parabéns pelos vídeos, tenho aprendido muito no seu canal. Você poderia me tirar uma dúvida? No caso de regressão logística binária, faz sentido falar em residuos? Eu fiquei pensando o seguinte: Se o output Y chapeu é uma variavel categorica binária, tipo SIM ou NÃO, o que seria o residuo vai ser a diferença entre o quê? Em uma OLS, faz sentido falar entre diferença entre valor real e valor esperado, mas na regressão logistica não sei como definir isso, já que a saida é uma variavel categorica.

@FernandaPeres 9 ай бұрын

Faz sentido, sim. Há mais de um tipo de resíduo, mas o "raw residual", que é o que a gente geralmente vezes analisa, é a diferença entre o valor observado (sendo considerado 1 ou 0) e a probabilidade prevista pelo modelo. O desfecho é categórico, mas o modelo está calculando a probabilidade de cada sujeito pertencer à categoria 1. Nesse link tem uma explicação com detalhes, e com códigos em R: library.virginia.edu/data/articles/understanding-deviance-residuals)

@guilhermearcoverde4776 3 жыл бұрын

Parabéns pelo ótimo trabalho! 👏🏼👏🏼👏🏼👏🏼

@FernandaPeres 3 жыл бұрын

Obrigada!! 😊

@datahoffmann 3 жыл бұрын

Anoto todas suas explicações no script que baixei para acompanhar a rotina.

@FernandaPeres 3 жыл бұрын

Ahh, que legal! Acho que esse sistema funciona bem 🥰

@luan-hn8mu 6 ай бұрын

quando eu fiz a analise do residuo padronizado, minhas observações estão fora da faixa de intervalo -3 até 3. Esta em -4. Eu devo excluir essas observações do modelo? Obrigada!!!

@paulopi997 5 ай бұрын

Deve ser mais de uma variável independente no modelo ou pode ser somente uma? Parabéns pelo conteúdo!! Vc é demais!!

@FernandaPeres 5 ай бұрын

Pode ser uma só, sim. Obrigada!

@paulopi997 5 ай бұрын

@@FernandaPeresque legal!! Muito obrigado!!!

@thaisdbf Жыл бұрын

Oi Fernanda! Primeiro, obrigada pelos vídeos, você está me salvando desde o meu mestrado hahaha Gostaria de tirar uma dúvida, por gentileza: em 16:55, há problema se os resíduos ultrapassam o min e o max de -3 até +3? No meu caso meus resíduos estão variando entre min -1.953932 e max 6.299312. Quando eu rodo o plot(mod, which = 5) parece estar tudo ok, nenhum ponto se aproxima ou ultrapassa a linha pontilhada de 0,5. Minha variável dependente é dicotômica e meu modelo tem outras 7 variáveis independentes categóricas.

@FernandaPeres Жыл бұрын

Olha, em tese, tudo bem. Mas eu olharia com atenção os outros gráficos de resíduos, porque com essa variação, não parece que os resíduos têm média zero e, muito provavelmente, não são homocedásticos.

@grazielealvesfagundesdossa9967 3 жыл бұрын

Top! Parabéns Fer!!

@jorge3633 7 ай бұрын

16:50 meus dados deram min: -3,4 max:1.16. já é um problema?

@alexiasiqueira7521 Жыл бұрын

Como proceder quando ao checar se há outliers, ele estiver fora da regra -3 +3??

@kaioalbarado3273 2 жыл бұрын

Seus videos estão me ajudando mto. Valeu Fê. Mas nao consigo visualizar a função glimpse. O que faço?

@FernandaPeres 2 жыл бұрын

Se você não está conseguindo usar o glimpse, é porque o pacote dplyr não está carregado. Recomendo assistir aos primeiros vídeos da playlist de R, que explica com mais detalhes instalação e carregamento de pacotes ;)

@gabrielmouta2796 2 жыл бұрын

Meus parabéns pela aula, Fernanda! O que fazer se o pressuposto do Box-Tidwell não for atendido? Retira a variável? Seria a idade da pessoa

@ricardocesar4621 Жыл бұрын

Por sinal, a parte de fazer e interpretar este teste foi cortada? Na parte 2 também nao mostra... Fernanda, seu conteúdo é excelente

@victoriafabris 3 жыл бұрын

Fernanda, fico muito feliz de ter encontrado suas aulas sobre esse tema específico aqui no KZbin! Além disso, com tanta qualidade! Uma dúvida: quando você utiliza a função pairs.panels() para visualizar as correlações , o que são os gráficos com figuras ovais? São uma outra forma de visualizar ascorrelações? Parabéns pelos vídeos e muito obrigada!

@FernandaPeres 3 жыл бұрын

Oi, Victória, muito obrigada! ❤️ Sim, são elipses de correlação!

@paulomauriciodealencastrog794 Жыл бұрын

Tive problema com a importação de caráteres latinos "não". Usei dados

@fernandapaularocha7266 3 жыл бұрын

Excelente aula, Fernanda. Fiquei com uma dúvida em relação a essa mudança quando se trata de regressão logística. Ao realizar esse procedimento, "simplesmente" aplicamos a função glm do pacote ISLR e pronto? Pergunto porque estou estudando pelo livro do Trevor Hastie e os bancos de dados utilizados já estão prontos para realizar a aplicação. No caso, por exemplo, se eu tiver n cidades com o número de assassinatos por mês entre os anos de 2014 a 2015, tenho que categorizar explicando pro R codificando a variável cidade e as datas? E se sim, será de forma semelhante a feita no vídeo? Desde já, muito obrigada!

@ecacarva 3 жыл бұрын

Ótima aula Fernanda ! O que fazer quando no comando: summary(stdres(modelo)) forem apresentados valores acima de +3 ou abaixo de -3 ?

@FernandaPeres 3 жыл бұрын

Isso seria um indício de que há outliers. Esses outliers podem ou não ser um problema para o modelo (enviesando os coeficientes, por exemplo). Não há um consenso, mas uma das principais sugestões é estimar o modelo com e sem os valores outliers e comparar os coeficientes. O gráfico dos resíduos x alavancagem também é excelente para avaliar se esses pontos discrepantes estão impactando a estimação dos coeficientes.

@alexandrecampos2765 2 жыл бұрын

Ótimo conteúdo. Só uma dúvida pontual: na linha 46 você o utiliza o nome da variável sem a necessidade de acrescentar o no me do banco + $. Mas antes vc não fez um pipe (%>%). No meu arquivo eu precisei informar o banco. O que eu perdi?

@alexandrecampos2765 2 жыл бұрын

Já entendi. Vc colocou ao final da expressão. Obrigado.

@FernandaPeres 2 жыл бұрын

@@alexandrecampos2765 Isso, eu declarei data = dados, por isso que não deu problema no meu.

@heitorcarvalho1628 3 жыл бұрын

Muito boa aula Fernanda Peres, parabéns! Queria saber uma informação e, talvez, até fazer um pedido. No caso da regressão logística politômica (multinomial), os passos apresentados no seu video são os mesmos? Se não o são, em projeto futuros no youyube, você poderia fazer um tutorial com esse tema? Desde já agradeço!

@FernandaPeres 2 жыл бұрын

Quase um ano depois, mas fiz recentemente, rs

@opengisog 3 жыл бұрын

Olá, Fernanda, parabéns pelos seus vídeos. São de suma importância para a comunidade. Eu tenho uma dúvida: quando a minha variável independente é nominal e possui mais de uma categoria e meus outputs ocorrem em todas elas, ou seja, não há uma variável de referência, já que todas de alguma maneira tem registro de ocorrência, como devo tratar? Um exemplo mais prático: quero estimar a ocorrência de deslizamento (variável dependente) de terra e dentre as variáveis tenho "solos" (variável independente categórica) que possui vários tipos de solos (cat 1, 2, 3, 4, n) e em cada tipo ocorrem deslizamentos em mais ou menos intensidade, ou seja, não é binária. Como esse dado entraria no meu modelo, considerando a questão da referência? Obrigado!

@fernandoaloisiohm Жыл бұрын

Professora, tem alguma indicação para o caso de amostra muito desbalanceada? Tenho um banco de dados cujo desfecho = 0 corresponde a 90% das observações. Com efeito, o modelo padrão é muito bom para classificar corretamente desfecho = 0, mas horrível para classificar corretamente desfecho = 1. Como o fenômeno que estou analisando é o desfecho = 1, mesmo com acurária overall de 90%, esse modelo é inútil. Visando resolver a questão, usei a função weight para dar peso 1 às obs com desfecho=0 e 9 para obs com desfecho = 1. Ocorreu, porém, que a hipótese do teste HL foi rejeitada (antes, sem atribuição de pesos, não era rejeitada). Já verifiquei os VIF, não há nada que comprometa a estimação. Sabe indicar alguma outra abordagem para lidar com amostra desbalanceada? Melhor que isso, tem algum vídeo teu tratando do assunto?

@FernandaPeres Жыл бұрын

Não tenho vídeo sobre isso, mas dê uma olhada em undersampling e oversampling.

@fernandoaloisiohm Жыл бұрын

@@FernandaPeres mais uma vez, obrigado

@nayara_magry Жыл бұрын

Obrigado pelo vídeo. Eu preciso fazer um modelo de regressão logística binária no R com duas variáveis dependentes categórica com apenas duas categorias (variável dicotômica). É possível?

@FernandaPeres Жыл бұрын

O modelo de regressão logística binária só aceita uma variável dependente. Não sei qual modelo funcionaria para duas variáveis dependentes dicotômicas...

@renantheodoro1097 3 жыл бұрын

Oi, tudo bem? Você sabe se passo 5, o teste "Box-Tidwell" também se aplica se as VI forem de contagem?

@arielefarias6296 2 жыл бұрын

voce tem o relatório desse material ?

@FernandaPeres 2 жыл бұрын

O script está na descrição do vídeo.

@julianafernandes5776 3 жыл бұрын

Fernanda, boa tarde! O balanceamento (quando tenho um banco de dados onde uma das respostas representa 75% das observações) é necessário, mesmo que não vá gerar treino e teste? Quero apenas entender variáveis preditoras em um caso específico. Muito obrigada!

@emersongaldino7366 3 жыл бұрын

Mto obrigado! Regressão Logística Multinomial no R, por favor... rsrsrsrs

@FernandaPeres 3 жыл бұрын

Ainda vai sair, rs. Só ajustando o script.

@HumbertoManeto 3 жыл бұрын

Se todas as variáveis independentes forem categóricas, é tranquilo fazer regressão logistica binária?

@FernandaPeres 3 жыл бұрын

Sim, isso não é um problema para esse modelo

@joaopedrorochadasilva3101 2 жыл бұрын

Olá, Fernanda! Executei o comando summary(stdres(mod)) em meu modelo, no caso repliquei todos seus ensinamentos mas em um banco de dados próprio para praticar e a seguinte informação aparece: Min. 1st Qu. Median Mean 3rd Qu. Max. -Inf -0.000083 -0.000069 -Inf -0.000069 3.585686 -Inf no mínimo e -inf na média. Apesar que todas as minhas variáveis tanto dependente quanto independentes são categoricas. Esse tipo de informação tira a efetividade da estimação?

@Epassos01 3 жыл бұрын

Fernanda, excelente trabalho! Essa semana enviei um convite pelo Linkedin. Gostaria de fazer uma consulta comercial. Por gentileza me retorne quando puder. Abraço.

@FernandaPeres 3 жыл бұрын

Oi, Ederson, você poderia me enviar um e-mail? Prefiro tratar assuntos de consultorias ou aulas particulares por lá. Muito obrigada! fernandafperes@hotmail.com

@gugapilar7548 3 жыл бұрын

Muito bom seu video! Lhe desejo muita sorte com o seu canal! Continue postando os videos! Obs.: Não quero lhe incomodar, mas se tiver um tempo para ir no meu canal e dar um feedback sobre meus vídeos (#gugapilar), agradeceria muito! Um abraço e fique bem! 🙏🏼