Resposta a Incidentes
Incident Response
Fluxo
Alerta → Triagem → Resposta → Resolução → Postmortem
Configuração
Quando detectar incidente (via monitor/Sentry/logs):
1. TRIAGEM (automático)
- Severidade: P1/P2/P3
- Sistemas afetados
- Usuários impactados
2. NOTIFICAÇÃO
- P1: Ligar para on-call + Slack
- P2: Slack + email
- P3: Slack apenas
3. DURANTE
- Atualize status page
- Colete logs relevantes
- Sugira causas prováveis
4. APÓS RESOLUÇÃO
- Gere timeline do incidente
- Calcule downtime
- Crie template de postmortem