Benutzer-Werkzeuge

Webseiten-Werkzeuge


  • Deutsch (German)
  • English
  • Français (French)
de:service-katalog:backup

SLA #001: Backup und Restore (SBR)

Version Status Datum Author URL
0.1 Erster Entwurf 24.04.2021 Egil Rüefli

Dienstleistungsbeschreibung

Servicebeschreibung

Der Service Backup und Restore (SBR) dient der automatischen Sicherung (Backup) und der Wiederherstellung (Restore) von Daten. Zur Nutzung des Dienstes muss clientseitig der Backupuser „rafisa-backup“ angelegt und mit entsprechenden Rechten versehen werden. Die dezentralen IT-Infrastrukturen, werden durch den Backupserver automatisch und regelmässig über das Rafisa-Netzwerk zentral gesichert. Der Status der Backups wird dem Helpdesk täglich per Mail gemeldet.

Angepasst an den jeweiligen Client stehen verschiedene Backuparten zur Verfügung:

  • Backup von SMB-Shares
  • File-Backup von Serversystemen
  • Image-Backup von Proxmox-VMs
  • Backup von Datenbank-Systemen
  • Backup der Konfigurationsdateien von Switches und Firewalls (im Aufbau)

Leistungsbeschreibung

Die vom Systemverantwortlichen einer IT-Infrastruktur definierten Daten werden durch den Backupserver gesichert und im Bedarfsfall wiederhergestellt. Das Dienstleistungsangebot umfasst:

  • Tägliche, automatische Datensicherung von Filesystemen und VM-Images
  • Es werden maximal 90 Backups aufbewahrt. Entsprechend beträgt die Aufbewahrungszeit bei einer täglichen Sicherung maximal 90 Tage
  • Wiederherstellung von einzelnen Dateien, ganzen Filesystemen, Datenbanken oder VM-Images
  • Tägliche Backupreports werden erstellt und zugänglich gemacht

Der Helpdesk der Rafisa wird täglich per Mail über den Status der Datensicherung informiert. Einzelne Dateien können nach Eröffnen eines entsprechenden Tickets durch die Helpdesk-Verantwortlichen wiederhergestellt werden. Restores von ganzen Servern oder Filesystemen werden durch das Team SBR vorgenommen.

Voraussetzungen

  • Für jedes zu sichernde System wird ein Systemverantwortlicher festgelegt
  • Der Systemverantwortliche definiert die zu sichernden Daten
  • Der Systemverantwortliche oder das Team SBR (gemäss Absprache) legt den Backupuser rafisa-backup mit den benötigten Rechten an
  • Die zu sichernden Systeme sind über das Rafisa Netzwerk jederzeit verfügbar

Betriebs- und Servicezeiten

Betriebszeiten Produktivsystem: 7 x 24 Stunden
Wartungsfenster Produktivsystem: Jederzeit ohne Vorankündigung
Servicezeiten Helpdesk: Mo - Fr 09:00 - 17:00 (ausg. Feiertage)

Leistung

Verfügbarkeit

Angestrebte Wiederverfügbarkeit nach Ausfall: Nächster Arbeitstag
Reaktionszeit während Bürozeiten (09:00 - 17:00): Bearbeitung von Problemen beginnt innerhalb 1h
Reaktionszeit Nacht: Nächster Arbeitstag (09:00)
Reaktionszeit Wochenende: Nächster Arbeitstag (09:00)
Reaktionszeiten für Rückmeldungen: siehe Kapitel Eskalation

Performanz

Backup: Die Backupinfrastruktur gilt als genügend performant, wenn tägliche Backups nach maximal 24h zum Restore zur Verfügung stehen. Die Datensicherungsdauer kann, abhängig von der zu sichernden Datenmenge, von der angestrebten Zeit abweichen.

Restore: Die Zeiten, die für einen Restore angestrebt werden, sind:

  • Max. 30 Minuten für Datenmengen kleiner als 100MB
  • Max. 1h für Datenmengen kleiner als 10GB
  • Max. 24h für Datenmengen grösser als 10GB

Das Team SBR geht davon aus, dass im Normalfall wesentlich bessere Geschwindigkeiten erzielt werden.

Kapazitäten

Das zentrale Datensicherungssystem bietet die Möglichkeit, grosse Datenmengen zu sichern. Das Team SBR sorgt dafür, dass im Rahmen des Kapazitätsmanagements notwendige Ressourcen den Kunden zur Verfügung stehen.

Backup Policy

Backupfrequenz: täglich
Backupzeitpunkt: nachts (19:30 - 07:00)
Aufbewahrungszeit: 90 Tage
Anzahl Kopien: 1

Eskalation

Severity-Level Kriterienbeschreibung

  1. Der Dienst ist nicht mehr benutzbar (nächtliche Backups werden nicht gemacht)
  2. Der Dienst ist teilweise nicht benutzbar (einige Backups konnten nicht erstellt werden)
  3. Unkritsche Störung ohne Auswirkungen auf die Backups

Severity-Level: Reaktionszeiten (erste Rückmeldung - periodische Rückmeldungen)

  1. sofort (30 Min) - periodisch 2h
  2. 60 Min. - periodisch 2h
  3. 1 Arbeitstag - nach Beendigung der Störung

Kritikalität

  1. Nach 4h Helpdesk und Teamlieader, nach 1 Tag Geschäftsleitung
  2. Nach 1 Tag Helpdesk und Teamleader, nach 2 Tagen Geschäftsleitung
  3. Nach 2 Tagen Helpdesk und Teamleader

Sicherheitsanforderungen & Katastrophenvorsorge

Sicherheit

Der physische Zutritt zum Serverraum ist gesichert. Der Backupserver befindet sich im Management-VLAN, die Verwaltungsoberfläche sowie der SSH-Zugang stehen nur in diesem VLAN zur Verfügung. Die Backup-Daten werden auf einer verschlüsselten Partition abgelegt.

Katastrophenvorsorge

Die Daten werden 1x im Monat auf eine externe Festplatte gespeichert und der Geschäftsleitung zur Aufbewahrung an einem externen Ort gegeben.

Leistungsreport

Über die Einhaltung der Leistungsziele wird im Monatsbericht Rechenschaft abgelegt.

Kosten

de/service-katalog/backup.txt · Zuletzt geändert: 2024/05/22 19:51 von e.rueefli