Guía para GUARDIAS e INCIDENTES en INGENIERÍA

  Рет қаралды 12,375

Pelado Nerd

Pelado Nerd

Күн бұрын

Пікірлер: 50
@HardyBeltran
@HardyBeltran 5 ай бұрын
Gracias Pelado, excelente información basada en la experiencia. Y me gustó el cierre, lo más importante es el cliente.
@jlopezariza
@jlopezariza 8 ай бұрын
he estado de guardia en diferentes servicios y creo que es el mejor resumen que se puede hacer.... por otra parte me gustaría añadir que es IMPORTANTE: hacer seguimiento de los postmortems ya que aunque tú lo hagas a conciencia, si no lo resuelves.... es como si no hubieras hecho nada!!Ç gracias pelado!
@xan646
@xan646 5 ай бұрын
Excelente video! Me hiciste acordar viejas épocas de guardias... Abrazo!
@RicharMunicoSamaniego
@RicharMunicoSamaniego 7 ай бұрын
PagerDuty es de los mejores, recuerdos ... lo integramos (para la resolución) con StackStorm/AWS System Manager (descartamos Rundeck)
@alerey4363
@alerey4363 8 ай бұрын
555 eso depende exclusivamente de si es un equipo de stage o prod y sobre todo del impacto que genere un reboot; el tipo de alertas viene configurado en el runbook cuando se hace el build o cuando hay un uplift de un equipo; es ahi donde se especifica la criticidad de las alertas y el tiempo de respuesta. Porque tambien tienes un error en eso de que es importante atender la alerta para no despertar a juan; aca la prioridad es el SLA y si el contrato de mantenimiento/soporte implica un delay de 5 min en responder antes un reboot inesperado entonces la prioridad es restablecer todos los servicios/aplicaciones involucradas; los reboots en mi empresa siempre generan incidente y son los que tienen el tiempo mas corto de respuesta (por supuesto hablo de un reboot no programado; ha pasado que un weiver no se configuro y un server genero incidente por reboot luego de un patching).
@PaulWhiskey
@PaulWhiskey 8 ай бұрын
Estuvo bueno el video, igual me toca hacer guardias, pero implementaron algo en teams en la parte de equipos para tomar las incidencias, saludos desde México.
@satoshinakamoto968
@satoshinakamoto968 8 ай бұрын
La conclusion es que hay que evitar a toda costa un laburo con guardias on-duty. Me hace gracia que se traten las horas de descanso internamente, cuando te puedes pasar toda la semana sin dormir por la noche. Habría que invertir la carga de la prueba, si algun dia duermes, laburas.
@jhonnathanaraujo7146
@jhonnathanaraujo7146 8 ай бұрын
Muy buen video. ¿Tienes algún video sobre Grafana OnCall? También sería bueno que hablaras sobre el escalamiento.
@fidelpalma5164
@fidelpalma5164 8 ай бұрын
Super interesante! Teníamos un script en asterisk que chequeaba los sistemas y si había alguno caído, nos llamaba. No había presupuesto para uno de esos sistemas jajajaaj.
@fidelpalma5164
@fidelpalma5164 8 ай бұрын
Y la rotación la hacíamos por semana, si la semana de la fecha era par, le caía a uno y si era impar, le caía a otro jaajaj
@skuldd
@skuldd 6 ай бұрын
¿Tienes algún listado de puntos negativos y destacables de PagerDuty, Opsgenie y VictorOps? Actualmente estoy creando una alternativa nueva a estas soluciones y no estaría mal oír cuál exactamente es tu inconformidad con estos productos. De antemano, ¡muchas gracias @PeladoNerd, es muy genial el contenido que haces! :)
@luks1003
@luks1003 8 ай бұрын
Hola pelado. Consulta estás enterado del incendio de un data Center del registro del automotor. Que nos podes explicar del tema. Para mí pasaron muchos día con incovenientes. Y supuestamente hoy tendría que estar todo funcionando. Alguna enseñanza con esta caso? Desde ya gracias!!
@luiseduardoaraujobohorquez801
@luiseduardoaraujobohorquez801 8 ай бұрын
Como se maneja los horarios de descanso luego de tener un incidente? Por que si me debo levantar a las 2 am y quedarme despierto hasta las 5 am (repreocupado de paso), y luego debo hacer horario laboral comun y corriente, es una tortura...
@PeladoNerd
@PeladoNerd 8 ай бұрын
Se maneja internamente, en el vídeo comenté que eso lo podes charlar con tu mánager para tomarte la mañana o el día siguiente
@luiseduardoaraujobohorquez801
@luiseduardoaraujobohorquez801 8 ай бұрын
@@PeladoNerd en mí caso soy mí propio mánager y mí propio jefe y a la vez mí propio explotador laboral jaja Tendré que flexibilizarme y tomarme la mañana entonces jaja
@nyk077
@nyk077 8 ай бұрын
Que tema para los que tenemos el sueño pesado, yo tenía que dormir con un reloj para que también me vibre porque no había manera de que escuche la alarma 😂
@PeladoNerd
@PeladoNerd 8 ай бұрын
Me pasó con un compañero que conectaba unos parlantes para que le suene fuerte la llamada a la noche jaja
@eliaspizarro0015
@eliaspizarro0015 8 ай бұрын
La idea del video se puede aplicar para otras plataformas de monitoreo como zabbix
@dos2ratosmas
@dos2ratosmas 8 ай бұрын
Nunca estuve de guardia, pregunta, la semana que estas de guardia tambien trabajas en la tarde? es un desquicio.
@luiseduardoaraujobohorquez801
@luiseduardoaraujobohorquez801 8 ай бұрын
Che... QUE BUEN VÍDEO, aporta un MONTON
@PabloAnglat
@PabloAnglat 8 ай бұрын
Me encantó este video Pablo!
@rclaros
@rclaros 8 ай бұрын
Excelente aporte
@Imnotacryptobro
@Imnotacryptobro 8 ай бұрын
Jamás volvería a tener un laburo con guardias
@JaminFernandez
@JaminFernandez 8 ай бұрын
Excelente
@Tony-so3xn
@Tony-so3xn 8 ай бұрын
¿Qué se sentirá trabajar en una empresa donde hay muchas responsabilidades y no solo un puñado de valientes que deben arreglarlo todo? Yo soy desarrollador y me han hablado por la madrugada para reparar el clúster de Kubernetes. Pero en fin, no siempre fue así. Después de la pandemia, es la realidad de muchos que trabajamos en negocios que reportan pérdidas.
@Tony-so3xn
@Tony-so3xn 8 ай бұрын
¡Nooo! Soy Pedro pero no quiero dar dislike
@agcb8969
@agcb8969 8 ай бұрын
Gracias!
@SantiagoMartinez-vb9hr
@SantiagoMartinez-vb9hr 8 ай бұрын
Hola pelado, estudie para sysadmin y actualmente estoy trabajando como soporte técnico en una empresa de internet, como tendria que ser mi guía de aprendizaje para llegar a ser sysadmin?
@PeladoNerd
@PeladoNerd 8 ай бұрын
roadmap.sh/devops
@sniperdaoud
@sniperdaoud 8 ай бұрын
y si cae el sistema de alertas que haces ?
@Desafecto
@Desafecto 5 ай бұрын
Lo ideal es pagar bien las guardias y pagar por servicio atendido. Verás como el pobre Pedro llega a la oficina con una sonrisa en lugar de enfadado.
@curiosocodigo3480
@curiosocodigo3480 8 ай бұрын
y en fin de año como se hace
@martinburgos6404
@martinburgos6404 8 ай бұрын
Pela consulta. Justo ahora estoy haciendo un sistema interno de comunicación con clientes e interna (account teams) cuando tenemos un incidente. Y la idea era crear un pequeño servicio de Python que escuche las alertas y en base a ciertos parámetros declarar automáticamente los incidentes. Mi idea es hacerlo con los logs, métricas y el sistema de alertas. Se te ocurre alguna sugerencia de usar alguna otra cosa?
@martinburgos6404
@martinburgos6404 8 ай бұрын
La idea es automatizar la creación de incidentes. No se si te parece una buena idea?
@BrandalisseGabi
@BrandalisseGabi 8 ай бұрын
Podés usar DataDog
@raulmunoz3878
@raulmunoz3878 8 ай бұрын
nosotros tenemos un recurso en india, asiq no hacemos 24/7, el hindu nos cubre en la noche🎉
@Juan-ey4np
@Juan-ey4np 8 ай бұрын
Jajajaja me parto con tus vídeos, la verdad que en un mundo ideal sería como tú dices pero en mi mundo aunque esa semana no este de guardia como sea un problema un poco jodido terminan llamándome a mi😂
@fpjorge87
@fpjorge87 8 ай бұрын
Pelaooo. Trabajo en el noc de una empresa americana. Tambien hacemos algo de incident management. Yo soy el que te despierta a las 3 de la mañana. Jjaajajja
@Kikindb
@Kikindb 8 ай бұрын
Un tema muy importante muy poco hablado por la comunidad en español
@adremides
@adremides 8 ай бұрын
¡Con razón! Me tenía que llamar Juan para que me tengan algo de piedad
@CarlosGuillenHernandez12378
@CarlosGuillenHernandez12378 8 ай бұрын
Todos somos Juan
@b14ckh4wk3
@b14ckh4wk3 8 ай бұрын
el 90% de incidentes se evitan no usando k8s
@gianibal
@gianibal 8 ай бұрын
Yo uso nagios
@cristiangiambruni4210
@cristiangiambruni4210 8 ай бұрын
Soy SRE (Simply Restart Everything 😅)
@carloscordobaruiz806
@carloscordobaruiz806 8 ай бұрын
Faltó grafana on-call
@xmagcx1
@xmagcx1 8 ай бұрын
pruebe apagar y prender, fin 😂
@luisgagocasas
@luisgagocasas 8 ай бұрын
X2
@mayikx
@mayikx 8 ай бұрын
Esa gente de desarrollo siempre tumba las aplicaciones. Son terribles.
@arturocardenas7095
@arturocardenas7095 8 ай бұрын
Y ni se diga cuando trabajas con gente de India
Q&A Junio 2024
20:40
Pelado Nerd
Рет қаралды 10 М.
La historia de la app CARA es interesante
19:49
Pelado Nerd
Рет қаралды 18 М.
Twin Telepathy Challenge!
00:23
Stokes Twins
Рет қаралды 96 МЛН
When Cucumbers Meet PVC Pipe The Results Are Wild! 🤭
00:44
Crafty Buddy
Рет қаралды 57 МЛН
The IMPOSSIBLE Puzzle..
00:55
Stokes Twins
Рет қаралды 167 МЛН
Todo el Software que usa un Principal SRE
18:32
Pelado Nerd
Рет қаралды 33 М.
Cómo se manejan las GUARDIAS en IT ? - (on call parte 2)
17:46
Pelado Nerd
Рет қаралды 18 М.
Esta herramienta gratis va EXPLOTAR tu productividad - Fabric
12:38
Todo sobre Let´s encrypt - La CA segura y sin fines de lucro
10:56
Tu PRIMER año en INGENIERÍA INFORMÁTICA | Lo que NADIE te dice
12:23
Commit That Line!
Рет қаралды 123 М.
WASM: WebAssembly es el futuro de los contenedores?
19:17
Pelado Nerd
Рет қаралды 60 М.
Todo lo que necesitas saber sobre MONITOREO
31:21
Pelado Nerd
Рет қаралды 42 М.
SCRUM + KANBAN [metodología ágil] / EJEMPLO /
10:53
Mejorar La Productividad
Рет қаралды 104 М.
Twin Telepathy Challenge!
00:23
Stokes Twins
Рет қаралды 96 МЛН