Aller au contenu
TYPEDébloqué
ÉTAPEProduction
DIFFICULTÉSimple
POURDevOps et infra
POURDevs backend
SERVICESTerminal
SERVICESSnapshots
SERVICESRéseau
POURQUOI HOODYVoyage temporel par snapshot
POURQUOI HOODYHTTP-natif
POURQUOI HOODYIsolation bare-metal
TYPEDébloqué
ÉTAPEProduction
DIFFICULTÉSimple
POURDevOps et infra
POURDevs backend
SERVICESTerminal
SERVICESSnapshots
SERVICESRéseau
POURQUOI HOODYVoyage temporel par snapshot
POURQUOI HOODYHTTP-natif
POURQUOI HOODYIsolation bare-metal
TYPEDébloqué
ÉTAPEProduction
DIFFICULTÉSimple
POURDevOps et infra
POURDevs backend
SERVICESTerminal
SERVICESSnapshots
SERVICESRéseau
POURQUOI HOODYVoyage temporel par snapshot
POURQUOI HOODYHTTP-natif
POURQUOI HOODYIsolation bare-metal
TYPEDébloqué
ÉTAPEProduction
DIFFICULTÉSimple
POURDevOps et infra
POURDevs backend
SERVICESTerminal
SERVICESSnapshots
SERVICESRéseau
POURQUOI HOODYVoyage temporel par snapshot
POURQUOI HOODYHTTP-natif
POURQUOI HOODYIsolation bare-metal
TERMINAL · SNAPSHOTS · 03:47

Fix prod d'urgence depuis votre téléphone

PagerDuty vous réveille. vous ne vous levez pas. vous ouvrez le bookmark du terminal de production. PATCH du snapshot d'avant le mauvais déploiement. La prod est de retour. Pas de bastion, pas de VPN, pas de laptop.

Lire la doc snapshots

Quatre gestes du pager au calme plat

L'astreinte, c'est du triage, pas du debug. L'URL terminal vous fait entrer. Le PATCH snapshot vous fait sortir. Le matin, c'est pour le vrai correctif.

Chemin d'incident depuis le téléphone uniquement4 ÉTAPES · 5 MINUTES
0103:42PAGER

Alerte qui arrive. Écran allumé, lampe de chevet éteinte.

0203:43TERMINAL

Ouvrez l'URL de terminal-1. tail du log. Repérez le changement d'env-var du déploiement de 23h.

0303:46RESTORE

PATCH /containers/[id]/snapshots/snap-20260504-035647. Le conteneur revient en arrière.

0403:47CALME

Le taux d'erreur retombe au niveau de base. Update envoyée sur le canal. Lumière éteinte.

Éditer sur téléphone, c'est l'enfer — donc le fix paresseux est le bon. Restaurez le conteneur au snapshot pris avant le mauvais déploiement. Le post-mortem de 11h décidera quoi changer pour de vrai.

Ce que le dashboard a montré

La même fenêtre, embarquée dans le navigateur de votre téléphone. Baseline, déploiement, pic, restore, calme plat. Vingt-huit secondes pour que le snapshot revienne.

dashboard.…hoody.com/error-rate
erreurs / minute6 dernières heures
23:00 · mauvais déploiement03:42 · pager03:47 · snapshot restauré
pic causé par la mauvaise env-varPATCH sur /snapshots/snap-20260504-035647

À 03:47 vous ne corrigez pas les bugs. vous rétablissez la disponibilité.

L'astreinte n'est pas une session de debug. C'est une session de triage. Les snapshots rendent le triage instantané, pour que le vrai debug se passe à 11h, par des humains qui ont dormi.

  • trier maintenant
  • diagnostiquer plus tard
  • dormir ce soir

Ce que ça remplace

La plupart des rituels d'astreinte sont les cicatrices d'une infra qui n'était pas accessible depuis un téléphone. L'URL HTTPS plus un PATCH de snapshot remplace toute une pile.

  • La box bastionUn saut supplémentaire avec ses propres credentials
  • Tunnel VPN depuis le litDeux facteurs et un timeout avant même de commencer à se battre
  • Rituel réveille-le-laptopCinq minutes de friction avant qu'une seule frappe ne compte
  • PDF du classeur d'astreintePage 14 du runbook sur un écran de 6 pouces
  • Scripts maison de jump-hostChaînes SSH fragiles que le nouveau ne sait pas lancer
  • Pager-le-seniorRéveiller un deuxième humain pour partager l'URL

vous avez ouvert une URL sur votre téléphone et restauré la prod.

Lire le guide snapshots

Lis les autres