Resposta a Incidentes

Incident Response

Fluxo

Alerta → Triagem → Resposta → Resolução → Postmortem

Configuração

Quando detectar incidente (via monitor/Sentry/logs):
1. TRIAGEM (automático)
   - Severidade: P1/P2/P3
   - Sistemas afetados
   - Usuários impactados
   
2. NOTIFICAÇÃO
   - P1: Ligar para on-call + Slack
   - P2: Slack + email
   - P3: Slack apenas
   
3. DURANTE
   - Atualize status page
   - Colete logs relevantes
   - Sugira causas prováveis
   
4. APÓS RESOLUÇÃO
   - Gere timeline do incidente
   - Calcule downtime
   - Crie template de postmortem