Por qué no debes aplicar cambios los viernes (ni justo antes de vacaciones, ni al terminar la jornada) - Iespai

Por qué no debes aplicar cambios los viernes (ni justo antes de vacaciones, ni al terminar la jornada)

Lecciones reales para desarrolladores y mantenedores que quieren dormir tranquilos

Introducción

Los filósofos dicen que no se puede predecir el futuro.
Los programadores decimos: “mejor no tocar nada en viernes”.

Y no es miedo irracional. Es experiencia. Porque si algo ha quedado claro en el mundo de la ingeniería de software, es que ciertos momentos están malditos para hacer cambios en producción.
Sí, ya sabes cuáles: viernes por la tarde, justo antes de las vacaciones, al cerrar el sprint, con la mochila ya al hombro.

Este post es un homenaje a esas decisiones impulsivas que acabaron en caos, con ejemplos reales que demuestran que aplicar cambios en el momento equivocado es una tradición milenaria del desastre digital.

Aquí tienes 10 razones para dejar ese deploy para otro día… con sus respectivos recordatorios históricos.

1. El viernes por la tarde

La semana ha sido larga. El cerebro pide cerrar todo. Y justo ahí, decides hacer un pequeño cambio.
Error clásico.

Caso real: Knight Capital (2012)
Actualización parcial en sus sistemas de trading. Algunas máquinas ejecutaban código viejo. Resultado: compras y ventas erráticas en bucle durante 45 minutos.
Pérdida: $440 millones. Fin de la empresa.

2. Justo antes de irte del trabajo

“Hago esto rápido y me voy”.
No lo harás. Vas a quedarte. Y vas a sufrir.

Caso real: GitLab (2017)
Un admin intentó arreglar una réplica antes de irse. Ejecutó mal un comando de limpieza:
borró la base de datos de producción.
18 horas de restauración, sin backups útiles.

3. Antes de vacaciones

El instinto de dejar “todo listo” es comprensible. Pero lo que dejas puede explotar mientras tú estás en modo avión.

Caso real: Slack (2021)
Un cambio mal ejecutado justo antes de fin de año causó un problema con su DNS interno. Resultado: caída general de Slack el 4 de enero.
Bienvenido al año nuevo.

4. Antes de un puente o festivo largo

Si algo sale mal, ¿quién estará para solucionarlo? Spoiler: nadie.

Caso real: OVH (2021)
Cambios en el sistema de alimentación se hicieron antes de festivo. Incendio en el datacenter.
No fue solo mala suerte. Fue timing desastroso.

5. Cuando el equipo de soporte no está

Aplicar cambios sin red de seguridad es jugar a ser héroe. Pero nadie aplaude cuando todo cae.

Caso real: Facebook (2021)
Un cambio en el sistema de BGP dejó a Facebook, WhatsApp e Instagram fuera de internet.
Lo peor: nadie podía acceder físicamente a los servidores para arreglarlo.

6. Cuando estás cansado

Los errores tontos florecen cuando estás agotado.
¿Seguro que esa línea no borra más de lo que debería?

Caso real: Amazon S3 (2017)
Un ingeniero cansado ejecutó un script de mantenimiento y eliminó un sistema crítico.
Caída masiva de servicios, dashboards y aplicaciones.
Hasta el panel de estado dejó de funcionar.

7. Sin rollback o backup

Cambiar sin poder volver atrás es como saltar sin paracaídas. Pero con logs.

Caso real: Pixar (Toy Story 2)
Un comando mal lanzado borró casi toda la película. ¿Backups? No funcionaban.
Se salvó porque una directora tenía una copia local para trabajar desde casa.

8. Sin revisión ni segunda opinión

El “yo lo reviso luego” es el primer paso hacia el “quién rompió esto”.

Caso real: Equifax (2017)
Un parche crítico no se aplicó porque se omitió la revisión. Resultado: robo de datos de 147 millones de personas.
Costó millones… y reputación.

9. Subestimando el cambio

No hay cambios “menores” en producción. Solo sorpresas mayores.

Caso real: Azure DevOps (2019)
Un pequeño cambio en la CDN provocó fallos en la distribución global. Se cayeron pipelines, builds y accesos.
Días después, aún descubrían efectos colaterales.

10. Por tachar un ticket antes del finde

Ese impulso de cerrar tareas puede más que la lógica. Y entonces… boom.

Caso real: todos los desarrolladores, en algún momento
Cambio menor, último commit del día, todo parece bien… hasta que empieza a fallar el login de usuarios, o los datos aparecen cruzados.

Conclusión: el empirismo salva vidas (y servidores)

Como dijo Hume, no podemos predecir el futuro. Pero si todos los viernes terminas con un incidente, quizás, solo quizás, debas dejar de hacer deploy los viernes.

Elige bien tus batallas. Cambia en horario laboral, con café, con equipo, con rollback.
El resto del tiempo, no es ingeniería. Es ruleta rusa digital.

Autor: Óscar Lastera Sánchez, y su fiel ayudante que nunca duerme (ni hace deploys en viernes): ChatGPT.

Oscar Lastera Sanchez

Cómo solucioné el error de renovación con Certbot: "Invalid response from /.well-known/acme-challenge"

Publicado por

Oscar Lastera Sanchez

Etiquetas: administración servidoresbuenas prácticas devopscambios en produccióncasos reales ITdeploy vierneserrores en TIfallos informáticosincidentes famososmantenimiento sistemas

2 semanas hace

Cómo solucioné el error de renovación con Certbot: «Invalid response from /.well-known/acme-challenge»

Durante la renovación de un certificado SSL con Certbot en un servidor Ubuntu con Apache,…

2 semanas hace

0. Transformación digital

5 años de revolución digital: cómo la tecnología está redefiniendo nuestra sociedad

La evolución de la digitalización global: 2019-2024 En tan solo cinco años, el mundo…

3 semanas hace

Informática

Redefiniendo la Ética de las Máquinas: Asimov y Kant Frente a la Inteligencia Artificial

La ciencia ficción ha sido, a lo largo del tiempo, un campo fértil para la…

1 mes hace

Notas

Di adéu a les notificacions! Assegura’t que els teus certificats TLS es renovin automàticament

Let's Encrypt ha estat una peça clau en la seguretat web en oferir certificats TLS…

1 mes hace

Informática

Guía para Instalar una Máquina Virtual en VirtualBox y Configurar un Servidor LAMP

En esta guía te explicaremos paso a paso cómo instalar una máquina virtual en VirtualBox…

1 mes hace

Marketing digital

¡Los Bloqueadores Están Declarando la Guerra a Bit.ly! Descubre Por Qué Tus Enlaces Están en Peligro

Los acortadores de URL, como bit.ly, se han convertido en herramientas esenciales para simplificar y…

1 mes hace

Esta web usa cookies.

Por qué no debes aplicar cambios los viernes (ni justo antes de vacaciones, ni al terminar la jornada)

Introducción

1. El viernes por la tarde

2. Justo antes de irte del trabajo

3. Antes de vacaciones

4. Antes de un puente o festivo largo

5. Cuando el equipo de soporte no está

6. Cuando estás cansado

7. Sin rollback o backup

8. Sin revisión ni segunda opinión

9. Subestimando el cambio

10. Por tachar un ticket antes del finde

Conclusión: el empirismo salva vidas (y servidores)

Entrada Relacionada

Entradas recientes

Cómo solucioné el error de renovación con Certbot: «Invalid response from /.well-known/acme-challenge»

5 años de revolución digital: cómo la tecnología está redefiniendo nuestra sociedad

Redefiniendo la Ética de las Máquinas: Asimov y Kant Frente a la Inteligencia Artificial

Di adéu a les notificacions! Assegura’t que els teus certificats TLS es renovin automàticament

Guía para Instalar una Máquina Virtual en VirtualBox y Configurar un Servidor LAMP

¡Los Bloqueadores Están Declarando la Guerra a Bit.ly! Descubre Por Qué Tus Enlaces Están en Peligro