Unternehmen verlassen sich zunehmend auf Sicherungen, um ihre Daten zu schützen und die Geschäftskontinuität im Falle einer Katastrophe sicherzustellen. Es wird jedoch geschätzt, dass mehr als 72% der Unternehmen nicht in der Lage sind, ihre IT-Wiederherstellungserwartungen im Zusammenhang mit ihren Wiederherstellungspunktzielen (RPO) und Wiederherstellungszeitziele (RTO) zu erfüllen.
Um Ihnen zu helfen, einen effizienten Wiederherstellungsplan zu erstellen, ist es unerlässlich, dass Sie ein vollständiges Verständnis von RTO und RPO entwickeln und etwas über die Unterschiede erfahren. Dieser Beitrag erklärt alles, was Sie über diese beiden Parameter für eine zuverlässige Notfallwiederherstellungsstrategie wissen müssen. Lesen Sie weiter, um herauszufinden, wie Sie durch straffere RPO und RTO den Datenverlust minimieren und den normalen Geschäftsbetrieb so schnell wie möglich nach einer Katastrophe wieder aufnehmen können.
Was ist RTO?
Das Wiederherstellungszeitziel (RTO) bezieht sich auf die maximale Ausfallzeit, die ein Unternehmen nach einem störenden Ereignis tolerieren kann. Andererseits ist RTO die Dauer zwischen dem Eintritt eines Unglücks und der Wiederherstellung der betroffenen kritischen Workloads.
Die RTO-Berechnung hängt im Allgemeinen von Ihrem Notfallwiederherstellungsplan, den verfügbaren Ressourcen und dem Budget ab. Wenn Ihre IT-Infrastruktur nicht verfügbar ist, benötigen Sie einige Zeit, um die Gründe für das Versagen zu identifizieren und die notwendigen Maßnahmen zur Behebung des Problems zu ergreifen. Es sollten jedoch Schritte zur Notfallwiederherstellung vorhanden sein, um sicherzustellen, dass wichtige Systeme und Arbeitslasten zugänglich und verfügbar sind, während das Produktionsproblem gelöst wird. Ihre RTO ist die Zeit zwischen dem Versagen und der Verfügbarkeit von Systemen über Backups oder Replikationsarbeitslasten.
Was ist RPO?
Das Wiederherstellungszeitziel (RPO) stellt die maximale Menge an Daten dar, die eine Organisation in einem Katastrophenfall ohne kritische Folgen verlieren kann. Diese Metrik wird in Stunden/Minuten seit dem letzten Backup/Replikationsprozess gemessen. Verwenden Sie es, um festzustellen, wie oft Sie Datenbackups und Replikationen erstellen müssen, um Datenverlust nach einem disruptiven Ereignis zu reduzieren.
In einer idealen Situation wird ein Backup- oder Replikationsjob gerade vor dem Versagen der Originalmaschine abgeschlossen. Dies ist jedoch im wirklichen Leben selten, daher besteht eine Lücke zwischen dem Zeitpunkt, an dem das letzte erfolgreiche Backup erstellt wurde, und dem Zeitpunkt, an dem die Originalmaschine ausfällt. Während dieser Zeit führte die VM Operationen durch und speicherte Daten, und höchstwahrscheinlich gehen diese Daten verloren.
Was ist RTO und RPO in der Katastrophenwiederherstellung
Das ultimative Ziel des Datenschutzes ist klar: Sie möchten sicherstellen, dass kritische Daten nicht verloren gehen, wenn etwas schief geht, und dass Sie die SLAs Ihrer Organisation in Bezug auf Betriebszeit und Verfügbarkeit einhalten können. Es ist jedoch ziemlich kostspielig, alle Änderungen in Ihrer virtuellen Umgebung in Echtzeit auf einen Notfallwiederherstellungsstandort (DR) zu spiegeln. Deshalb müssen Sie akzeptieren, dass Sie einige Daten verlieren und Ihre IT-Services im Falle eines Ausfalls unterbrochen werden. Ihre Aufgabe ist es daher, diese Verluste und Unterbrechungen zu minimieren.
Lassen Sie uns die Konzepte von RPO und RTO anhand eines einfachen Diagramms veranschaulichen:
Das Diagramm zeigt ein häufiges Szenario: Eine virtuelle Maschine stürzt aus irgendeinem Grund ab. Die gelbe Linie repräsentiert das RPO, das die Zeit zwischen dem letzten Backup und der Störung darstellt. Die orangefarbene Linie ist das RTO und spiegelt die Zeit wider, die benötigt wird, um die VM wiederherzustellen.
Unterschiede zwischen RTO und RPO
Um zu verstehen, wie man RTO und RPO bestimmt, sollten Sie sich ihre Unterschiede und ihre Rolle im DR-Prozess ansehen.
Evaluation
- RTO befasst sich in erster Linie mit dem Zeitraum, innerhalb dessen Geschäftsabläufe während eines Katastrophenfalls wieder aufgenommen werden sollen. Die zu berücksichtigenden Punkte sind:
- Bewerten Sie die Bedürfnisse und Prioritäten Ihrer Organisation, da sie für jede Organisation einzigartig sind.
- Überlegen Sie, welche Anwendungen für die Dienste und Anwendungen kritisch sind, die für das Überleben der Organisation entscheidend sind, sowie welche Auswirkungen es haben könnte, wenn diese Anwendungen ausfallen würden.
- Bestimmen Sie die Reihenfolge, in der jedes System/ jede Anwendung wiederhergestellt werden sollte, um eine erfolgreiche Wiederherstellung bei einem Katastrophenfall mit minimalen Ausfallzeiten zu gewährleisten.
- RPO ist eher darauf ausgerichtet, die Menge an Daten zu erfassen, die während eines Ausfalls verloren gehen können, ohne ernsthafte Schäden am finanziellen Ergebnis einer Organisation zu verursachen. Die zu berücksichtigenden Punkte sind:
- Ermitteln Sie die Häufigkeit von Backup/Replikation und wie viele Daten zwischen dem neuesten VM-Backup und einer tatsächlichen Katastrophe verloren gehen könnten.
- Berücksichtigen Sie die Menge an Daten, die Ihre Organisation für jede Art von Arbeitslast verlieren kann.
Kosten
Der Hauptunterschied zwischen RTO und RPO besteht darin, dass ersteres alle Aspekte der Geschäftsstruktur und des DR-Prozesses als Ganzes berücksichtigt, während letzteres nur die Bedeutung von Daten und Anwendungen für die Geschäftskontinuität berücksichtigt. Daher kann das Erreichen von RTO-Werten eine anspruchsvolle und teure Aufgabe sein, um eine schnelle Wiederherstellung sicherzustellen. Ebenso bedeutet das Vorhandensein kleinerer RPOs, dass Sie häufiger Backups durchführen und zusätzliche Wiederherstellungspunkte erstellen müssen, was Ihre Speicherkosten erhöhen kann.
Automatisierung
- Da sich RPO auf Daten und die Widerstandsfähigkeit Ihres Systems gegenüber Verlust konzentriert, wird empfohlen, häufige Datensicherungen durchzuführen. Viele moderne Backup-Lösungen ermöglichen automatisierte VM-Backups, sodass Ihre Backup-Strategien effizient an Ihre RPO-Ziele angepasst werden können und mit minimalem Aufwand Ihrerseits.
- Die Erreichung von RTO ist ein komplexerer Prozess, da alle Geschäftsprozesse und Systemkomponenten berücksichtigt werden müssen, die während eines DR-Ereignisses wiederhergestellt werden müssen. Es wird jedoch empfohlen, den gesamten DR-Prozess von Anfang bis Ende zu automatisieren und zu orchestrieren, um sicherzustellen, dass Ihre RTO-Ziele erreicht werden können.
Berechnungsfreundlichkeit Die RPO -Metrik ist einfach zu berechnen, da sie nur einen Aspekt des Wiederherstellungsprozesses abdeckt – Daten.
- Die RPO -Metrik ist einfach zu berechnen, da sie nur einen Aspekt des Wiederherstellungsprozesses abdeckt – Daten.
- RTO berücksichtigt alle Aspekte Ihrer Organisation, einschließlich der Bedeutung Ihrer Daten und Dienste, der Kosten für Ausfallzeiten, Investitionen in DR-Aktivitäten usw. Beim Berechnen des RTO sollten Sie die verschiedenen Arten von Workloads und Anwendungen berücksichtigen, da sie unterschiedliche Wiederherstellungsprozesse haben können. Es ist ratsam, den RTO auf der Grundlage eines Geschäftskontinuitätsplans zu berechnen, der mögliche Geschäftsrisiken und -bedrohungen umreißt und die Schritte beschreibt, die unternommen werden müssen, um die Geschäftsabläufe wieder aufzunehmen.
Um den RTO zu definieren, der auf die verschiedenen Workloads in Ihren Organisationen zutrifft, beantworten Sie die folgende Frage:
Wie lange kann eine bestimmte Anwendung/System/Maschine ausfallen, ohne dass dies einen signifikanten Einfluss auf die Kerngeschäftsabläufe Ihrer Organisation hat?
Nachdem Sie diese Frage für verschiedene Maschinen beantwortet haben, überlegen Sie, ob die erwarteten Ergebnisse Ihren aktuellen Geschäftsanforderungen gerecht werden können. Falls nicht, überlegen Sie, wie Sie Ihre Backup- und DR-Strategien verbessern können, um die gesicherten Daten so aktuell wie möglich zu halten.
Wie Sie mit NAKIVO eine engere RPO und RTO erreichen
NAKIVO Backup & Replication ermöglicht es Ihnen, Backups von virtuellen und physischen Maschinen häufiger zu erstellen und damit die RPO zu verbessern. Planen Sie einfach regelmäßige Backups mit einem Intervall, das nicht länger als Ihr Ziel ist.
Die Lösung hilft auch, die Wiederherstellungszeit (RTO) mit sofortiger VM-Wiederherstellung und Replikationsfunktionen für VMware vSphere, Microsoft Hyper-V und Amazon EC2 zu reduzieren. Integrieren Sie Ihre Netzwerküberwachungsdienste und lösen Sie unmittelbar nach dem Ausfall einer VM einen Wiederherstellungsprozess aus. Sie können auch Offsite-Repliken (genaue Kopien) wichtiger VMs erstellen. Wenn die originale VM ausfällt, werden die Repliken automatisch gestartet. Wenn die Aufrechterhaltung von Repliken mehr Ressourcen erfordert, als Sie sich leisten können, können Sie die sofortige VM-Startfunktion aus dem Backup auswählen.
Um die kürzesten RTOs zu erreichen, hat NAKIVO Backup & Replication die Site Recovery-Orchestrierungsfunktion eingeführt. Automatisieren Sie vollständig das VM-Failover und Failback für verschiedene DR-Szenarien und führen Sie nicht störende Tests durch, um eine Wiederherstellung innerhalb des erwarteten Zeitrahmens zu gewährleisten.