Runbook: Redémarrage Redis¶
PD-3 CA-05 | Temps max: 10 min | Prérequis: Accès SSH, droits sudo
Prérequis¶
- Accès SSH au serveur Redis (dev/staging/prod)
- Droits sudo sur le serveur
- Connaissance du mot de passe Redis (dans Vault:
kv/infra/redis)
Diagnostic¶
1. Vérifier l'état du service Redis¶
Résultat attendu: Active: active (running) ou message d'erreur
2. Vérifier la connectivité Redis¶
Résultat attendu: PONG
3. Vérifier les logs Redis¶
Résolution¶
Étape 1: Arrêter Redis proprement¶
Étape 2: Vérifier l'arrêt¶
Résultat attendu: Active: inactive (dead)
Étape 3: Redémarrer Redis¶
Étape 4: Vérifier le redémarrage¶
Résultat attendu: Service active (running) et réponse PONG
Vérification¶
1. Vérifier la persistance AOF¶
Résultat attendu: appendonly = yes
2. Vérifier les jobs préservés¶
Résultat attendu: Liste des clés BullMQ non vide (si jobs existaient avant restart)
3. Vérifier via l'API backend¶
Résultat attendu: {"status": "healthy"}
Rollback¶
Si le redémarrage échoue:
1. Vérifier les logs d'erreur¶
2. Vérifier la configuration¶
3. Restaurer depuis backup (si corruption)¶
sudo systemctl stop redis
sudo cp /var/lib/redis/dump.rdb.backup /var/lib/redis/dump.rdb
sudo systemctl start redis
Critère de succès¶
- Service Redis
active (running) -
redis-cli pingretournePONG - Jobs BullMQ préservés (clés
bull:*présentes) - API
/health/redisretournehealthy
Références¶
- PD-3-specification.md: INV-03 (persistance)
- PD-3-plan.md: Phase 4
- TC-NOM-02: Reprise après interruption