Disaster Recovery
Grundlegende Metriken
RTO (Recovery Time Objective)
- Maximale Ausfallzeit
- Wie schnell wiederhergestellt?
- Geschäftsanforderung
RPO (Recovery Point Objective)
- Maximaler Datenverlust
- Zeitpunkt des letzten Backups
- Bestimmt Backup-Frequenz
DR-Strategien
Cold Standby
- Backup-Daten vorhanden
- Infrastruktur bei Bedarf
- RTO: Stunden bis Tage
- RPO: Stunden
- Niedrigste Kosten
Warm Standby
- Infrastruktur läuft (reduziert)
- Daten repliziert
- RTO: Minuten bis Stunden
- RPO: Minuten
- Mittlere Kosten
Hot Standby
- Vollständige Infrastruktur
- Synchrone Replikation
- RTO: Minuten
- RPO: Sekunden
- Höhere Kosten
Active-Active
- Beide Sites aktiv
- Load Sharing
- RTO: Sekunden
- RPO: Null
- Höchste Kosten
Cloud-DR-Architekturen
Backup to Cloud
- On-Premise Produktion
- Cloud als Backup-Ziel
- Kostengünstig
- Längere Wiederherstellung
Pilot Light
- Kern-Infrastruktur in Cloud
- Minimal betrieben
- Schnell hochskalierbar
Warm Standby (Cloud)
- Skalierte Version in Cloud
- Kontinuierliche Replikation
- Schneller Failover
Multi-Region Active-Active
- Mehrere Cloud-Regionen
- DNS-basiertes Routing
- Höchste Verfügbarkeit
DR-Komponenten
| Komponente | Strategie |
|---|---|
| Datenbank | Replikation, Backup |
| Applikation | Multi-AZ/Region |
| Storage | Cross-Region Replikation |
| DNS | Failover Routing |
| Secrets | Backup/Replikation |
DR-Testing
Test-Typen
- Tabletop Exercise
- Partial Failover
- Full Failover
- Chaos Engineering
Test-Frequenz
- Tabletop: Quartalsweise
- Partial: Halbjährlich
- Full: Jährlich
DR-Runbook
- Incident-Erkennung
- DR-Aktivierung Entscheidung
- Failover-Ausführung
- Validation/Smoke Tests
- DNS-Umschaltung
- Stakeholder-Kommunikation
- Failback-Planung
Kosten-Optimierung
- Reserved Capacity für Warm Standby
- Spot Instances für Tests
- Cross-Region Replication Kosten
- Egress-Kosten beachten
CFTools Software entwickelt und testet DR-Strategien für Unternehmen.