Hola, saludos desde Paraguay. Muy buen material, buena explicación, gracias por compartir su conocimiento. Éxitos!
@dianamustelier96842 жыл бұрын
Muy buena explicación, justo lo que estaba buscando para explicar mi modelo. Gracias!
@profesorjaviervillar Жыл бұрын
Buena explicación, colega. Claro y preciso.
@JOLUADE Жыл бұрын
excelente explicación, me ayudo mucho
@anaibethnessi66429 ай бұрын
Muya agradecida! Excelente explicación
@joseantoniogarcia33504 жыл бұрын
Excelente video estimado Profesor, posee Usted, sin duda, el buen Don de la pedagogía en el entorno virtual. Una oportunidad de mejora y de agregar valor para los usuarios de su trabajo, entre los que me gratamente me cuento, seria hacer accesible la base de datos que emplea para el desarrollo de los videos.Esto permitiría replicar el ejercicio en casa y obtener una mejor comprensión del contenido expuesto en el mismo. Llegue a Usted mi sincero respeto, JAG.
@juarmita4 жыл бұрын
Gracias por tus palabras, José Antonio. Y gracias por la sugerencia: la tengo en cuenta y adjuntaré los datos en cuanto vuelva a retomar la presencia activa en el canal.
@lourdessuarezvillasmil2 жыл бұрын
Gracias, excelente explicación!
@yulymosquera72149 ай бұрын
Buen día @Juanma Gargon. En el bloque 1, cuando haces referencia a que el modelo tiene un contraste significativo, para determinar esto la significancia debe ser menor a 0.05? AGRADEZCO TU RESPUESTA.
@juarmita9 ай бұрын
Hola, Yuly. Es lo más común, sí, pero en realidad fijar el p-valor previamente nos sirve para hacer intervalos de confianza (y alguna cosa más). Una vez tienes hecho el análisis, puedes interpretar el p-valor con el nivel de significación que consideres, es decir, con el 0.05 (que puedes fijar como tu límite), pero también con el 0.01 o el 0.001, ya como veas. Suerte!
@ERIKAMANUELAORTEGAJURADO Жыл бұрын
Hola, te hago una pregunta, que pasa si el beta es negativo, como se interpreta?
@juarmita Жыл бұрын
Hola! Si el beta es negativo, entonces la OR estará entre 0 y 1. Tienes un ejemplo de interpretación en el vídeo :-)
@lorenavargas10472 жыл бұрын
Buen día. ¿El Intervalo de confianza para el coeficiente de patologías como lo interpreta? Porque el coeficiente esta dentro del intervalo. Desde ya muchas gracias!!!! Saludos desde Bs As
@juarmita2 жыл бұрын
Gracias! El IC al 95%, por su propia construcción, siempre tiene dentro a la OR. Nos muestra el rango en que se movería esa OR y nos muestra así la variabilidad que puede tener. Nos permite relativizar esa OR de alguna manera y comprender los posibles errores de estimación.
Excelente trabajo y explicación, muchas Gracias. ¿Podrías hacer uno con logística multinomial incluyendo predictoras nominales, dicotómicas (como sexo) y politómicas? Saludos.
@juarmita3 жыл бұрын
Todo se andará!
@robertooropezatena26653 жыл бұрын
Buen día, muy bien explicado, muchas gracias!! Una duda, de todos los resultados que comentó, ¿cuáles sería más importante reportar en el documento? ¿no tiene algún video donde se señale cómo se reportarían los resultados? Felicidades!!!
@juarmita3 жыл бұрын
Gracias, Roberto. Pues no tengo ninguno en lo que se refiere a escritura, me lo apunto para futuros vídeos. Particularmente soy de descripciones breves y concisas y, sobre todo, intentando no usar los números. Ahora bien, sí que tengo un vídeo sobre cómo hacer tablas resumen para la logística. Lo tienes en el canal!
@presidentetropical2 жыл бұрын
Buenas tardes Profesor, tengo una pregunta, el valor BETA (B) qué indica? es lo único que no logro entender de regresión logística. Muchas gracias!
@juarmita2 жыл бұрын
Hola, Gioele. Perdona la tardanza en responder. La beta es el coeficiente de la ecuación logística. Nos sirve para calcular las odds ratios y las razones de probabilidad de cada variable en el modelo.
@six.elev3stn7382 жыл бұрын
Great job! I have a question: if I run the analisys including 2 or more independent variables, the sig. value is different than the value I get when I run a single analisys for each independent variable. Why is it so?
@juarmita2 жыл бұрын
Hi. This occurs because the independent variables produce interactions among them -the effect of the control variables. In the case of a single IV, obviously there is no effect of those variables. That is the essence of multivariate analysis: controlling for other variables to have more rigorous analyses.
@brandonemersonguillencalle6978 Жыл бұрын
Hola, aquí muestras como se calcula también el OR (Odds Ratio) por cada categoría, quisiera saber por favor cómo estimar también el RP crudo y ajustado, me dicen que se usa regresión de Poison pero creo que a ti te entendería mejor. Saludos desde Perú!
@juarmita Жыл бұрын
Hola, Brandon. Efectivamente, lo más común -y probablemente lo más correcto- para calcular razones de prevalencia es usar regresión de Poisson. La puedes encontrar en modelos lineales generalizados y de manera intuitiva se interpreta prácticamente de la misma manera que las OR. Suerte!
@r.6467 Жыл бұрын
Hola JuanMa, tien s algún video o puedes recomendarme algún tu tutorial sobre la regresión ordinal en SPSS. Gracias y un saludo
@juarmita Жыл бұрын
Hola! Pues la verdad es que no sabría decirte, lo siento. A ver si me animo a hacer algo :-)
@cecilialara19072 жыл бұрын
Hola Dr., una duda, que pasa sí en la mayoría de mis Betas exponenciales son negativas? (Ej, -0.140, -0.030)
@juarmita2 жыл бұрын
Hola, Cecilia. Pues sería raro. Las OR o exp(B) te deberían salir > 0, no sé qué puede haberte pasado... A no ser que estés mirando las beta, ¿es posible?
@miguelfranciscogalvancabel64024 жыл бұрын
Que tal, estimado. Muy buena serie de videos sobre regresión logística. Me surge la duda en la interpretación que haces d elos odds ratio de las variables Patologías previas y tabaquismo. La interpretación la haces de la misma forma para ambas, es decir, dejando el mismo valor de referencia. Sin embargo, cuando lanzaste el análisis configuraste que la variable tabaquismo fijara su valor de referencia el primer valor, es decir el 0; y para la variable Patologías previas dejaste el valor de referencia último = 1. Por lo tanto, entiendo que la interpretación debería ser contraria entre las variables, puesto que una tiene un valor de referencia 0 y la otra un valor de referencia 1.
@juarmita4 жыл бұрын
Gracias, Miguel Francisco. En la parte 2/3 podrás ver que para tabaquismo se toma como referencia "sí fuma" y para patologías previas se toma como referencia "sí tiene".
@agustinharoleon4942 жыл бұрын
Hola Juanma, saludos y gracias de nuevo por tus vídeos, ¿si tenemos una base de datos con muchas variables independientes y una dependiente, ¿sería mejor hacer grupos de cinco variables independientes y hacer 4 regresiones o hacer una regresión de una vez con todas las independientes? Muchas gracias
@juarmita2 жыл бұрын
Hola, Agustín. Pues depende de tu objetivo y de si los grupos de variables tienen un sentido. Si es así, es una muy buena opción hacer modelos escalonados hasta que llegues a un modelo final con todas las variables y veas el efecto conjunto.
@agustinharoleon4942 жыл бұрын
@@juarmita muchas gracias
@patriciahart66004 жыл бұрын
Holaaaa en el caso de la variable de nivel educativo, si el valor de p hubiera sido significativo, y el valor de b negativo, como se interpreta? A menor nivel educativo menor riesgo?
@juarmita4 жыл бұрын
En el caso por ejemplo de Estudios Primarios, si hubiera sido significativo, al ser la b negativa (y el OR < 1), significa que las personas con nivel de estudios primarios tienen menor riesgo que las que tienen estudios universitarios, que es la referencia. La clave está siempre en comparar con la categoría de referencia.
@patriciahart66004 жыл бұрын
@@juarmita ay noooo, puedes brindarme unos minutos de tu vida para que veas mis resultados? 🥺🥺🥺
@juarmita4 жыл бұрын
Podría resolverte dudas puntuales, Patricia, pero me costaría más revisar algo más amplio sin el contexto general de la investigación. Todas las dudas que tengas, me las puedes plantear por acá e intento resolverlas :)
@milagrosblancartegomez91164 жыл бұрын
Buenas tardes profesor, saludos desde México. Al momento del analisis ¿cómo se puede interpretar si se tiene en alguna variable una p significativa pero el OR menor a 1? muchas gracias
@juarmita4 жыл бұрын
Hola, Milagros. Te copio una respuesta que di más abajo, espero que te sirva :-) En ese caso, y solo si es significativa (p < 0.05) lo lees en sentido inverso: los que se encuentran en esa situación tienen una menor probabilidad de padecer la enfermedad (o la variable dependiente que sea en cada caso). Una opción si prefieres leerlo en sentido "positivo" es hacer la inversa de la OR. Por ejemplo, si la OR = 0.5, divides 1 / 0.5 = 2, y lo lees o bien tomando la otra categoría de la VD, o bien cambiando la categoría de referencia en la VI.
@alimh98 Жыл бұрын
Por otro lado, si tengo una hipótesis que afirme una relación POSITIVA entre dos variables, y esta relación me sale significativa, pero la B negativa.. habría que rechazarla? o aceptarla pero justificar por qué sale negativa de alguna forma? muchas gracias de antemano :)
@juarmita Жыл бұрын
Hola, Ali! Perdona por la tardanza. En este caso estás en que no se cumple tu hipótesis. No pasa nada, se trata de explicar por qué pasa eso y revisar si es una cuestión de los datos, de la muestra o de un cambio en las condiciones de la variable. O simplemente que tu hipótesis no fuera la adecuada. O una combinación de algunas de ellas. ¡Suerte!
@marialuisamiguelberges15813 жыл бұрын
Hola, como podría contactar contigo para clases particulares? gracias
@juarmita3 жыл бұрын
Lo siento, María Luisa, no imparto clases particulares. ¡Suerte en la búsqueda de profe!
@alimh98 Жыл бұрын
Hola!! Tengo entendido que para interpretar la exponencial beta hay que partir de 1, si tengo una exponencial de 1,35 sería un 35% más de probabilidad, y si es una exponencial de 0,85 sería un 15% menos de probabilidad. Sería así? mis datos son escalas y la dependiente dicotomizada
@juarmita Жыл бұрын
Hola! Para no entrar en cálculos porcentuales y como, hasta donde sé, SPSS no calcula marginales -a lo mejor sí, no lo sé al 100%-, creo que lo más fácil es que hagas la inversa de la OR y lo interpretes en positivo. En este caso, 1/0.85 = 1.17, y así ya sería solo interpretar con base en la otra categoría. Creo que te puede facilitar la vida. ¡Suerte!
@marianelahuamanichoquehuan18484 жыл бұрын
Buen día profesor. Sobre los OR que resultan de la regresión logística, ¿estos deben coincidir con los OR que reportan las tablas bivariadas de 2*2?. Por otro lado, dado que se trata de dos procedimientos, ¿de qué forma complementa los resultados de la regresión logística a los resultados de procedimientos previos: Análisis en tablas vibariantes y multivariantes?
@juarmita4 жыл бұрын
Hola, Marianela. Las OR coinciden solo si en la logística tienes las dos mismas variables que en la tabla 2x2 -en este caso primaría el principio de parsimonia y es preferible la tabla, por ser un procedimiento más simple. Al introducir más variables en un logit, necesariamente las OR van a cambiar -no tiene por qué cambiar demasiado, pero se modifican. Las tablas nos dan una primera aproximación a las relaciones bi o trivariantes que, posteriormente, nos van a ayudar a comprender mejor las relaciones multivariantes que resulten de la logística. Por ejemplo, en un caso que tengamos p-valores limítrofes o dudas en el sentido de una v. ordinal con una categoría díscola.
@robertinamendez71172 жыл бұрын
Que quiere decir cuando hay redundancias en el modelo?
@paulaseminaratorcivia92104 жыл бұрын
Buen día, gracias por el video. Si el exp. B es menor que 1, tal como en el caso de vivir solo, etc. Cómo podrías leerlo? Tiene menos probabilidad de tener la enfermedad o sólo se leen los mayores a 1?
@juarmita4 жыл бұрын
Hola Paula. En ese caso, y solo si es significativa (p < 0.05) lo lees en sentido inverso: los que se encuentran en esa situación tienen una menor probabilidad de padecer la enfermedad (o la variable dependiente que sea en cada caso). Una opción si prefieres leerlo en sentido "positivo" es hacer la inversa de la OR. Por ejemplo, si la OR = 0.5, divides 1 / 0.5 = 2, y lo lees o bien tomando la otra categoría de la VD, o bien cambiando la categoría de referencia en la VI.
@paulaseminaratorcivia92104 жыл бұрын
Infinitas gracias
@carlosa.medinacampos80254 жыл бұрын
Hola. Muchas gracias por su explicación. Me ha servido mucho. Quisiera preguntar. Cómo interpreto la OR cuando la variable es numérica.. en el ejemplo que nos puso, la edad? Es decir el OR que arroja la regresión logística no es significativo, pero en caso que lo sea.... cómo interpreto el OR en función de la edad... es decir.... cuantas veces se incremente o disminuye el riesgo de tener o no la enfermedad en función de la edad? Muchas gracias :)
@juarmita4 жыл бұрын
Gracias por tu comentario, Carlos. Para interpretar una VI numérica que te resulte significativa en tu modelo tienes que entenderla tal que en cuanto aumenta una unidad esa VI, la probabilidad de que ocurra el suceso de estudio de la VD se multiplicará por esa cantidad: si es < 1, la prob disminuye; si es > 1, la prob aumentará. Por ejemplo, si con edad numérica sale un OR = 1.058 (p < 0.001), eso significa que la prob de padecer la enfermedad aumenta con la edad, en concreto, por cada año adicional se multiplica por ese OR. Espero que te sirva esta breve explicación. Un saludo!
@saram94294 жыл бұрын
Hola. Me ha servido mucho su explicación. Muchas gracias por compartirla. Me surge una duda: Si la prueba ómnibus de coeficientes de modelo no es significativa, ¿nada de lo que se pueda interpretar a continuación sería significativo? Por ejemplo, si la prueba ómnibus no fuera significativa, ¿podría ocurrir que en la tabla de Variables de la ecuación apareciera alguna variable con sig
@juarmita4 жыл бұрын
Hola, Sara. La prueba ómnibus contrasta que todos los coeficientes sean cero (H0) o que al menos haya uno diferente de cero (H1). Si sale no significativa, se estima que todos son cero, por lo que es improbable que haya un beta significativo. Ahora bien, improbable pero no imposible, dado que todo contraste está sujeto a errores. Si así se diera, lo interpretaría con mucha cautela y, lo que haría, sería hacer un nuevo modelo con otros factores para intentar explicar mejor el fenómeno que estés estudiando.
@saram94294 жыл бұрын
@@juarmita Muchísimas gracias por su respuesta!
@anagabrielaolvera1618 Жыл бұрын
Antes que nada, muchísimas gracias por la explicación me ayuda mucho a entender mi modelo de regresión que estoy haciendo. Tengo una duda espero me pueda ayudar, en una variable me salió con una B de -.997, una sig. de .012 y un ratio de .369 Lo puedo tomar como una factor de protección para no tener la enfermedad? Mil gracias y saludos desde México!
@juarmita Жыл бұрын
Hola! Disculpa la tardanza. Es un factor relevante, sin duda, no sé si protector o de riesgo porque no sé cómo está medido, pero claramente significativo. Ahora bien, lo más importante es que le añadas una explicación que esté basada principalmente en las evidencias y la literatura; la estadística por sí sola no nos explica nada. Suerte!
@denitzadally7915 Жыл бұрын
Tengo una consulta: si en la tabla de clasificacion del modelo predictivo me sale 0 cuando es SI - SI a que puede deberse? porque estoy utilizando 18 variables el tamaño de grupo total es de mas de 400k y los SI de la variable dependiente son 3k Ayuda porfa
@juarmita Жыл бұрын
Me falta mucha información sin ver la tabla, pero puede ser que sea porque tienes poca muestra (400k vs 3k) y se te quedan casillas demasiado poco numerosas. También puede ser que con las 18 variables haya alguna que no esté funcionando bien, ya sea por su distribución o porque tenga pocos casos. Se me ocurren esas opciones. ¡Suerte!
@denitzadally7915 Жыл бұрын
@@juarmita como puedo ver el tipo de distribucion que tiene cada variable? porque en general el modelo tiene una buena significancia
@juarmita Жыл бұрын
@@denitzadally7915 Eso lo puedes hacer en spss con el comando Explorar, que suele funcionar muy bien y da mucha información.
@cocoviano Жыл бұрын
qué tan importantes es el r cuadrado? es que me da muy bajo en mi modelo... aunque son todas las variables son significativas... no entiendo por qué me da tan tan tan bajo si se supone que debería ser lo contrario. hay otro estadístico que se pueda usar para esto? o cómo puedo mejorarlo?
@juarmita Жыл бұрын
Hola, Consuelo. En un modelo de regresión logística no me preocuparía demasiado por el R2...
@yonathancalvofernandez55683 жыл бұрын
Creo que hay un error en el reporte de resultados y como consecuencia en la interpretación: La variable patologías previas de acuerdo a como estaba codificada y como se reportan los resultados, su categoría de referencia es NO (código 1) por lo que su coeficiente es negativo. Es decir está reflejado al revés. En este contexto, se arrojan unos resultados un tanto extraños ya se que puede inferir que no presentar patologías previas predispone a una mayor probabilidad (ventaja) de desarrollar la enfermedad (y viceversa). Confírmame si lo ves igual, Juanma. Si es asi... ¿tendrías la base de datos correcta? Un saludo.
@juarmita3 жыл бұрын
Hola, Yonathan. Gracias por tu mensaje y las ideas que das. Los datos están en parte "tuneados" para una mejor comprensión del método, por lo que es posible que salgan relaciones poco lógicas o sujetas a las hipótesis clásicas sobre el tema. Al final lo importante de estos vídeos es saber cómo hacer la regresión logística. Cada persona posteriormente podrá adaptarlo a su tema en concreto; en mi caso, es sobre la presencia de una enfermedad ficticia -aun con datos reales, pero que están totalmente anonimizados en todos los sentidos para evitar cuestiones de sensibilidad y protección de los datos. Gracias de nuevo, un saludo y suerte!
@six.elev3stn7382 жыл бұрын
Una pregunta: porqué, si hago una regresión con 2 o mas variables independientes, el resultado es diferente de lo que obtengo cuando hago una regresión para cada variable independiente?
@juarmita2 жыл бұрын
Hola. Esto ocurre porque cuando hay varias VI se producen interacciones -lo que, dicho de modo simple, sería el efecto de las variables de control. En el caso de una única VI no está el efecto de esas variables. De hecho, esa es la esencia del análisis multivariante: controlar por otras variables para tener análisis más rigurosos.
@mariomorocho8032 жыл бұрын
Hola q tal excelente video y explicación podrias compartir los datos ya que no funciona el link del enlace
@juarmita2 жыл бұрын
Parece que da problemas de seguridad. Están alojados en una carpeta de dropbox. Prueba porfa sin bloqueadores, cortafuegos o similares, porfa.
@yonatancalvo17913 жыл бұрын
Buenas tardes Juanma: Enhorabuena por tu explicación. 1-Aprecio que no comentas nada acerca de los casos atípicos y observo que se reportan 4 casos: el 3, 5, 29 y 31. ¿No deberían revisarse o excluirlos del modelo para ver cómo se comporta? 2-¿No consideras que sería adecuado comentar la significación de la prueba de Hosmer y Lemeshow?: al reportar una sig.>0,05 podemos decir que hipótesis de que la curva logística es apropiada para los datos, ya que se obtiene una significación = 0,513 > 0,05 es decir se acepta la hipótesis de que es apropropiada. Quedo a la espera de que me comentes tu opinión al respecto, para conocerla y seguir aprendiendo. Un saludo.
@juarmita3 жыл бұрын
Gracias, Yonatan. Te intento conntestar: 1) Sí, efectivamente habría que revisarlos siempre. No lo hicimos porque son muy muy poco comunes en respuestas categóricas cerradas de encuesta -de hecho, no debería haber nunca en estos casos-, que son la mayoría que presentamos aquí. Para variables numéricas sí es muy relevante mirarlos. 2) Al tener una n grande, es muy poco frecuente que la prueba de Hosmer-Lemeshow nos resulte para que la logística sea inoperante. Importante mirarlo con tamaños de muestra pequeños. Un saludo.
@victorcisternas44633 жыл бұрын
crack!
@marianievescampistrus60124 жыл бұрын
Excelente explicación, clara y concisa. muchas gracias. Soy médico y mi formación estadística ha sido informal, no obstante he usado a menudo el SPSS y la regresión logística binaria en varios estudios de investigación clínica. Mi pregunta se refiere a la "constante" que aparece en la columna de variables independientes. Qué significa? cómo se debe interpretar? Ocurre que el SPSS permite no incluir esa "constante", en cuyo caso los resultados obtenidos al aplicar el modelo son totalmente distintos. Agradezco desde ya su amable respuesta.
@juarmita4 жыл бұрын
Hola María Nieves. Gracias a ti. Te doy una explicación muy práctica. La constante se refiere a un modelo en el que no hay variables predictoras. ¿Para qué nos sirve entonces? Para comprobar el valor que toma la VD cuando todas las VI no se relacionan con esa VD de estudio. De manera muy práctica, nos puede pasar: a) que ninguna VI explique a la VD, el modelo no nos sirve si buscamos predictores o factores explicativos, o b) que haya alguna VI que sea predictora o explicativa, en cuyo caso la constante no tiene un significado de interés. Más allá de eso hay otras utilidades más técnicas, pero a efectos prácticos esta es la idea. Espero que te sirva :-)
@marianievescampistrus60124 жыл бұрын
@@juarmita Muchas gracias.
@fabrissiograndi9194 жыл бұрын
Muy buenas!!! Duda importante. Tengo como variable dependiente: patología (tenerla/no tenerla) (codificación del SPSS: 0 (sanos)/ 1 (demencia)). Y me sale para la variable independiente "años de educación" (cuantitativa, de intervalo) significancia estadística (p = 0.000) y, aquí viene lo interesante, una odds ratio de 1.210 (es la OR más alta de todas las VI que he metido en SPSS). ¿Esto significa que a mayor educación tienes 1.210 más de probabilidad de tener la demencia???????? !!! la educación????? (tengo además un B de 0.191).
@juarmita4 жыл бұрын
Hola Fabrissio. Como tienes educación en # años, significa que cuando aumenta una unidad esa variable, es decir, cuando se tiene un año más de educación, la probabilidad de que se dé tu suceso aumenta, sí. No parece acorde a una hipótesis. Se me ocurre preguntarte cómo tienes categorizada la variable padecer demencia: ¿cuál es la categoría de análisis, es decir, que el SPSS te categoriza como 1? También puede ser que no estén funcionando las v. de control. Si es demencia, podría funcionar la edad: a más edad, más demencia, y si no está incluida, se pierde ese control. Por dar una idea... No entiendo lo que dices de la b de 0.191. ¿Es la asociada a educación?
@danielsantana10163 жыл бұрын
no creo que wald lo tendrías q eliminar y mas si vas a ser estudios a futuro. El chiste de wald es ver que sean diferentees de 0 para ver que tanto predice tu modelo
@juarmita3 жыл бұрын
Hola, Daniel. En Ciencias Sociales solemos trabajar poco con modelos predictivos y nos dedicamos en general a modelos explicativos. En todo caso, para la predicción del modelo logístico tenemos varias herramientas en SPSS, si bien no salen en este vídeo. Apuntada la idea para algún otro nuevo.
@danielsantana10163 жыл бұрын
@@juarmita si es una regresión aún q sea explicativo si estando dentro de la categoría de predictivo. De hecho de eso se trata una regresión. Ahora sí el estadístico de Wald está más cercano a 0 y haces un step forward eso te ayuda conocer tu modelo
@juarmita3 жыл бұрын
@@danielsantana1016 no soy muy fan del step-forward porque para lo explicativo prefiero la fotografía completa, pero bueno, el análisis tiene estas vertientes variadas. Hay que usar lo que de el mayor rigor dentro de nuestro diseño de investigación.
@danielsantana10163 жыл бұрын
@@juarmita NO CREO VIEJO, usualmente el modelo completo no esta tan relacionado. Pero en lo que concuerdo es siempre depende que busques, el objetivo y los diseños anteriores marcan la pauta.