GNU/Linux >> LINUX-Kenntnisse >  >> Linux

Linux-Geschichten:Als Backups den Tag retteten

Dieser Artikel ist eine Geschichte aus meiner Vergangenheit. Ich habe früher als Systemadministrator für ein Unternehmen gearbeitet, das einen Online-Shop betrieb, der Computerhardware und -software verkaufte.

Im Hintergrund arbeiteten Dutzende von Mitarbeitern über einen Terminalserver mit der ERP-Software, die alle Waren und den Handel verwaltete. Terminalserver und Datenbanken waren entscheidend für den Geschäftsprozess des Verkaufs unserer Produkte. Als eines dieser Systeme ausfiel, konnten Dutzende von Mitarbeitern ihre Arbeit nicht mehr erledigen und Kunden konnten nichts mehr kaufen.

Wie lange haben wir noch?

Also haben wir uns mit dem Eigentümer des Geschäftsprozesses zusammengesetzt und gefragt:„Nun, stellen Sie sich eine Situation vor, in der das System kaputt und nicht mehr nutzbar ist. Wie lange müssen Sie sich erholen, bis der Schaden für das Unternehmen verheerend wäre?“ Der Manager dachte lange nach und sagte:„Zwei Stunden, max!“

Wir setzten uns mit den Mitarbeitern der ERP-Anwendung zusammen und fragten sie:„Wie lange würde es dauern, die Anwendung neu zu installieren und den Terminalserver zu konfigurieren, wenn wir uns nach einem schwerwiegenden Systemausfall erholen müssten?“ Die Antwort war:"Zwei Tage, Minimum!" Ich denke, Sie können die Lücke hier sehen.

Für mich bestand die erste Priorität darin, die Wiederherstellungszeit von zwei Tagen auf unter zwei Stunden zu verkürzen. Die Neuinstallation des Betriebssystems, der Anwendungen und das Wiederherstellen von Datensicherungen war keine Option, da dies zu lange dauert. Ich habe mich für eine Imagesicherungsanwendung entschieden, die eine vollständige Systemsicherung durchführen kann, d. h. das Betriebssystem, installierte Anwendungen, Bibliotheken und Daten. Mit dieser Software könnte ich das System wiederherstellen, ohne dass manuelle Installationsaufgaben abgeschlossen werden müssten.

Was brauchen wir?

Eine klassische Einrichtung besteht darin, die Sicherung nachts auszuführen, wenn niemand arbeitet. Im Fehlerfall müssten wir das Image von letzter Nacht oder vielleicht eine noch ältere Version wiederherstellen. In diesem Szenario hat ein Test ergeben, dass wir fünf Stunden für eine vollständige Wiederherstellung benötigten. Das ist besser als zwei Tage, aber immer noch nicht gut genug. Und es gibt ein weiteres Problem, das in diesem Ansatz verborgen ist. Wenn das System abends abgestürzt ist und wir das Backup der letzten Nacht wiederherstellen müssen, gehen alle Änderungen des aktuellen Tages verloren. Das war für unseren Onlineshop nicht akzeptabel. Nun, unser erster Gedanke war, jede Stunde ein inkrementelles Backup durchzuführen. In diesem Fall würden wir nur die Daten der letzten Stunde verlieren. Aber was passiert, wenn das Problem, das unser System beschädigt, bereits im Backup-Image vorhanden ist, wenn wir das Problem entdecken? Nun, hier ist, was wir getan haben.

Wir haben uns noch einmal zusammengesetzt und darüber gesprochen, wie lange es dauert, bis ein verheerendes Problem entdeckt wird, das zu einer Wiederherstellung des Systems führen würde. Wir haben uns auf einen Zeitrahmen von vier Stunden geeinigt. Zusammenfassend wollten wir so wenig Arbeit wie möglich verlieren, in maximal zwei Stunden wiederherstellen und sicherstellen, dass sich ein Problem nicht bereits im Backup befindet, wenn wir es entdecken. Mit diesen Informationen habe ich einen Backup-Ansatz entwickelt, den Softwareanbieter als sofortige Wiederherstellung, Schattenwiederherstellung, präventive Wiederherstellung oder einen ähnlichen Begriff bezeichnen. Wir haben jede Stunde inkrementelle Backup-Jobs ausgeführt und die Backups im Hintergrund auf einer neuen virtuellen Maschine wiederhergestellt. Zu jeder vollen Stunde hatten wir ein System fertig, das vier Stunden in der Zeit zurücklag und nur noch fertiggestellt werden musste. Wenn ich mich also dafür entscheide, die inkrementelle Version von vor einer Stunde wiederherzustellen, würde dies weniger Zeit in Anspruch nehmen als eine vollständige Systemwiederherstellung, da nur die kleinen Inkremente auf der fast fertigen virtuellen Maschine wiederhergestellt werden müssten.

Und der Aufwand hat sich gelohnt

Eines Tages war ich im Urlaub, habe gegrillt und ein Bier getrunken, als mich ein Kollege angerufen hat, der mir mitteilte, dass der Terminalserver mit der ERP-Anwendung aufgrund eines fehlgeschlagenen Updates kaputt war und der Typ, der das Update durchgeführt hat, vergessen hat, es zu nehmen zuerst einen Schnappschuss.

Das einzige, was ich meinem Kollegen sagen musste, war, die kaputte Maschine herunterzufahren, die Benutzeroberfläche unseres Sicherungs-/Wiederherstellungssystems zu finden und dann den Wiederherstellungsjob zu identifizieren. Schließlich sagte ich ihm, wie er den Zeitstempel der letzten vier Stunden auswählen sollte, wann die Wiederherstellung abgeschlossen sein sollte. Die Wiederherstellung war 30 Minuten später abgeschlossen und das System war wieder einsatzbereit. Nach insgesamt 30 Minuten waren wir wieder im Einsatz, und nur die Arbeit der letzten zwei Stunden war verloren! Fantastisch! Jetzt zurück in den Urlaub.

Schluss machen

Denken Sie also daran, dass Zeit und Geld für eine gut geeignete Sicherungs- und Wiederherstellungslösung gut investiert sind, wenn es um eine Notfallwiederherstellung geht.

[ Kostenloser Online-Kurs:Technische Übersicht zu Red Hat Enterprise Linux. ]


Linux
  1. Zähmen des tar-Befehls:Tipps zum Verwalten von Backups unter Linux

  2. Linux – Wie bekomme ich Pacman dazu, die benutzerdefinierten Pkgbuilds beim Aktualisieren zu verwenden?

  3. Beschleunigen Sie rsync, wenn Sie einen Linux-Server über die Befehlszeile migrieren

  4. Der Befehl locate unter Linux

  5. So finden Sie heraus, wann die Spfile auf einem Linux-Server erstellt wurde

Stellen Sie ein altes MacBook mit Linux wieder her

Die zehn größten Linux-Geschichten des Jahres 2015

Was ist die Shell unter Linux?

So finden Sie heraus, wer das Linux-System wann neu gestartet hat

Der Timer-Befehl in Linux

Linux - Welche Verzeichnisse sollte ich beim Sichern eines Servers ausschließen?