Inhaltsverzeichnis
SLA #001: Backup und Restore (SBR)
Version | Status | Datum | Author | URL |
---|---|---|---|---|
0.1 | Erster Entwurf | 24.04.2021 | Egil Rüefli |
Dienstleistungsbeschreibung
Servicebeschreibung
Der Service Backup und Restore (SBR) dient der automatischen Sicherung (Backup) und der Wiederherstellung (Restore) von Daten. Zur Nutzung des Dienstes muss clientseitig der Backupuser „rafisa-backup“ angelegt und mit entsprechenden Rechten versehen werden. Die dezentralen IT-Infrastrukturen, werden durch den Backupserver automatisch und regelmässig über das Rafisa-Netzwerk zentral gesichert. Der Status der Backups wird dem Helpdesk täglich per Mail gemeldet.
Angepasst an den jeweiligen Client stehen verschiedene Backuparten zur Verfügung:
- Backup von SMB-Shares
- File-Backup von Serversystemen
- Image-Backup von Proxmox-VMs
- Backup von Datenbank-Systemen
- Backup der Konfigurationsdateien von Switches und Firewalls (im Aufbau)
Leistungsbeschreibung
Die vom Systemverantwortlichen einer IT-Infrastruktur definierten Daten werden durch den Backupserver gesichert und im Bedarfsfall wiederhergestellt. Das Dienstleistungsangebot umfasst:
- Tägliche, automatische Datensicherung von Filesystemen und VM-Images
- Es werden maximal 90 Backups aufbewahrt. Entsprechend beträgt die Aufbewahrungszeit bei einer täglichen Sicherung maximal 90 Tage
- Wiederherstellung von einzelnen Dateien, ganzen Filesystemen, Datenbanken oder VM-Images
- Tägliche Backupreports werden erstellt und zugänglich gemacht
Der Helpdesk der Rafisa wird täglich per Mail über den Status der Datensicherung informiert. Einzelne Dateien können nach Eröffnen eines entsprechenden Tickets durch die Helpdesk-Verantwortlichen wiederhergestellt werden. Restores von ganzen Servern oder Filesystemen werden durch das Team SBR vorgenommen.
Voraussetzungen
- Für jedes zu sichernde System wird ein Systemverantwortlicher festgelegt
- Der Systemverantwortliche definiert die zu sichernden Daten
- Der Systemverantwortliche oder das Team SBR (gemäss Absprache) legt den Backupuser
rafisa-backup
mit den benötigten Rechten an - Die zu sichernden Systeme sind über das Rafisa Netzwerk jederzeit verfügbar
Betriebs- und Servicezeiten
Betriebszeiten Produktivsystem: 7 x 24 Stunden
Wartungsfenster Produktivsystem: Jederzeit ohne Vorankündigung
Servicezeiten Helpdesk: Mo - Fr 09:00 - 17:00 (ausg. Feiertage)
Leistung
Verfügbarkeit
Angestrebte Wiederverfügbarkeit nach Ausfall: Nächster Arbeitstag
Reaktionszeit während Bürozeiten (09:00 - 17:00): Bearbeitung von Problemen beginnt innerhalb 1h
Reaktionszeit Nacht: Nächster Arbeitstag (09:00)
Reaktionszeit Wochenende: Nächster Arbeitstag (09:00)
Reaktionszeiten für Rückmeldungen: siehe Kapitel Eskalation
Performanz
Backup: Die Backupinfrastruktur gilt als genügend performant, wenn tägliche Backups nach maximal 24h zum Restore zur Verfügung stehen. Die Datensicherungsdauer kann, abhängig von der zu sichernden Datenmenge, von der angestrebten Zeit abweichen.
Restore: Die Zeiten, die für einen Restore angestrebt werden, sind:
- Max. 30 Minuten für Datenmengen kleiner als 100MB
- Max. 1h für Datenmengen kleiner als 10GB
- Max. 24h für Datenmengen grösser als 10GB
Das Team SBR geht davon aus, dass im Normalfall wesentlich bessere Geschwindigkeiten erzielt werden.
Kapazitäten
Das zentrale Datensicherungssystem bietet die Möglichkeit, grosse Datenmengen zu sichern. Das Team SBR sorgt dafür, dass im Rahmen des Kapazitätsmanagements notwendige Ressourcen den Kunden zur Verfügung stehen.
Backup Policy
Backupfrequenz: täglich
Backupzeitpunkt: nachts (19:30 - 07:00)
Aufbewahrungszeit: 90 Tage
Anzahl Kopien: 1
Eskalation
Severity-Level Kriterienbeschreibung
- Der Dienst ist nicht mehr benutzbar (nächtliche Backups werden nicht gemacht)
- Der Dienst ist teilweise nicht benutzbar (einige Backups konnten nicht erstellt werden)
- Unkritsche Störung ohne Auswirkungen auf die Backups
Severity-Level: Reaktionszeiten (erste Rückmeldung - periodische Rückmeldungen)
- sofort (30 Min) - periodisch 2h
- 60 Min. - periodisch 2h
- 1 Arbeitstag - nach Beendigung der Störung
Kritikalität
- Nach 4h Helpdesk und Teamlieader, nach 1 Tag Geschäftsleitung
- Nach 1 Tag Helpdesk und Teamleader, nach 2 Tagen Geschäftsleitung
- Nach 2 Tagen Helpdesk und Teamleader
Sicherheitsanforderungen & Katastrophenvorsorge
Sicherheit
Der physische Zutritt zum Serverraum ist gesichert. Der Backupserver befindet sich im Management-VLAN, die Verwaltungsoberfläche sowie der SSH-Zugang stehen nur in diesem VLAN zur Verfügung. Die Backup-Daten werden auf einer verschlüsselten Partition abgelegt.
Katastrophenvorsorge
Die Daten werden 1x im Monat auf eine externe Festplatte gespeichert und der Geschäftsleitung zur Aufbewahrung an einem externen Ort gegeben.
Leistungsreport
Über die Einhaltung der Leistungsziele wird im Monatsbericht Rechenschaft abgelegt.