Organisaties vertrouwen steeds meer op back-ups om hun gegevens te beschermen en bedrijfscontinuïteit te waarborgen in geval van een ramp. Het wordt echter geschat dat meer dan 72% van de bedrijven niet in staat is om te voldoen aan hun verwachtingen met betrekking tot de herstelpuntdoelstellingen (RPO) en de hersteltijdobjectieven (RTO) van hun IT-herstel.
Om u te helpen bij het opstellen van een efficiënt herstelplan, is het essentieel dat u een volledig begrip ontwikkelt van RTO en RPO en leert over de verschillen. In dit bericht wordt alles uitgelegd wat u moet weten over deze twee parameters voor een betrouwbare rampenherstelstrategie. Lees verder om te ontdekken hoe u strakkere RPO en RTO kunt realiseren om gegevensverlies te minimaliseren en de normale bedrijfsactiviteiten zo snel mogelijk te hervatten na een ramp.
Wat is RTO?
De hersteltijdobjectief (RTO) verwijst naar de maximale hoeveelheid uitvaltijd die een organisatie kan tolereren na een ontwrichtende gebeurtenis. Met andere woorden, RTO is de tijdsduur tussen het optreden van een ramp en het herstel van getroffen kritieke werklasten.
De RTO-berekening hangt over het algemeen af van uw rampenherstelplan, beschikbare middelen en budget. Terwijl uw IT-infrastructuur niet beschikbaar is, heeft u wat tijd nodig om de reden(en) voor het falen te identificeren en de noodzakelijke actie te ondernemen om het probleem op te lossen. Er moeten echter stappen voor rampenherstel worden genomen om ervoor te zorgen dat kritieke systemen en workloads toegankelijk en beschikbaar zijn terwijl het productieprobleem wordt opgelost. Uw RTO is de tijd tussen het falen en de beschikbaarheid van systemen via back-ups of replica workloads.
Wat is RPO?
Het recovery point objective (RPO) vertegenwoordigt de maximale hoeveelheid gegevens die een organisatie kan verdragen te verliezen bij een ramp zonder ernstige gevolgen. Deze metriek wordt gemeten in uren/minuten sinds de laatste back-ups/replicatieproces. Gebruik het om te bepalen hoe vaak u gegevensback-ups en replica’s moet maken om gegevensverlies na een verstorende gebeurtenis te verminderen.
In een ideale situatie wordt een back-up- of replicatietaak vlak voor het falen van de originele machine voltooid. Dit is echter zeldzaam in het echte leven, dus er is een kloof tussen het moment waarop de laatste succesvolle back-up is gemaakt en het moment waarop de originele machine faalt. Gedurende deze tijd voerde de VM operaties uit en werden er gegevens opgeslagen, en hoogstwaarschijnlijk gaan deze gegevens verloren.
Wat is RTO en RPO in rampenherstel
Het ultieme doel van gegevensbescherming is duidelijk: je wilt er zeker van zijn dat kritieke gegevens niet verloren gaan als er iets misgaat en dat je aan de SLA’s van je organisatie kunt voldoen op het gebied van uptime en beschikbaarheid. Het is echter vrij kostbaar om alle veranderingen in je virtuele omgeving in real-time te spiegelen naar een disaster recovery (DR) site. Daarom moet je accepteren dat je wat gegevens zult verliezen en dat je IT-diensten worden onderbroken in het geval van een storing. Je taak is dus om deze verliezen en onderbrekingen te minimaliseren.
Laten we de concepten van RPO en RTO illustreren met een eenvoudig diagram:
Het diagram toont een veelvoorkomend scenario: Een virtuele machine crasht om een of andere reden. De gele lijn vertegenwoordigt de RPO, dat is de tijd tussen de laatste back-up en de onderbreking. De oranje lijn is de RTO en weerspiegelt de tijd die nodig is om de VM te herstellen.
Verschillen tussen RTO en RPO
Om te begrijpen hoe je RTO en RPO kunt bepalen, moet je kijken naar hun verschillen en hun rol in het DR-proces.
Evaluatie
- RTO richt zich primair op de periode waarin wordt verwacht dat bedrijfsactiviteiten worden hervat tijdens een ramp. De punten om te overwegen zijn:
- Evalueer de behoeften en prioriteiten van uw organisatie, omdat deze uniek zijn voor elke organisatie.
- Bedenk welke toepassingen het meest kritiek zijn voor de diensten en toepassingen die cruciaal zijn voor het voortbestaan van de organisatie, evenals wat de gevolgen kunnen zijn als deze toepassingen zouden falen.
- Bepaal de volgorde waarin elk systeem/toepassing moet worden hersteld om een succesvolle rampenherstel te garanderen met minimale verliezen door downtime.
- RPO richt zich meer op de hoeveelheid gegevens die tijdens downtime kunnen worden verloren zonder ernstige schade toe te brengen aan de financiële positie van een organisatie. De punten om te overwegen zijn:
- Identificeer de frequentie van back-up/replicatie, en hoeveel gegevens mogelijk verloren kunnen gaan tussen de laatste VM-back-up en een daadwerkelijke ramp.
- Bedenk hoeveel gegevens uw organisatie zich kan veroorloven te verliezen voor elk type workload.
Kosten
Het belangrijkste verschil tussen RTO en RPO is dat de eerste rekening houdt met alle aspecten van de bedrijfsstructuur en het DR-proces als geheel, terwijl de laatste alleen rekening houdt met de kritieke aard van gegevens en toepassingen voor continuïteit van het bedrijfsleven. Daarom kan het behalen van RTO-waarden een veeleisende en dure taak zijn om een snelle herstel te garanderen. Evenzo betekent een kleinere RPO dat u meer back-ups moet uitvoeren en extra herstelpunten moet creëren, wat uw opslagkosten kan verhogen.
Automatisering
- Omdat RPO gericht is op gegevens en de weerbaarheid van uw systeem tegen verlies, wordt aanbevolen om regelmatige gegevensback-ups uit te voeren. Veel moderne back-upsystemen staan u toe om geautomatiseerde VM-back-ups uit te voeren, zodat uw back-upstrategieën op een efficiënte manier op uw RPO-doelen kunnen worden afgestemd, en met weinig inbreng van uw kant.
- Het behalen van RTO is een complexer proces om te beheren, aangezien het rekening houdt met alle bedrijfsprocessen en systeemcomponenten die tijdens een DR-gebeurtenis moeten worden hersteld. Daarom wordt aanbevolen om het hele DR-proces van begin tot eind te automatiseren en te orkestreren om te zorgen dat uw RTO-doelen kunnen worden behaald.
Gemak van berekening
- De RPO metriek is eenvoudig te berekenen, omdat het slechts één aspect van het herstelproces omvat – gegevens.
- RTO houdt rekening met alle aspecten van uw organisatie, inclusief de belangrijkheid van uw gegevens en diensten, de kosten van downtime, investeringen in DR-activiteiten, enz. Bij het berekenen van de RTO moet u rekening houden met de verschillende soorten workloads en toepassingen, aangezien ze verschillende herstelprocessen kunnen hebben. Het is raadzaam om de RTO te berekenen op basis van een bedrijfscontinuïteitsplan, waarin mogelijke bedrijfsrisico’s en bedreigingen worden beschreven, en de stappen die moeten worden genomen om de bedrijfsactiviteiten te hervatten.
Om de RTO te bepalen die van toepassing is op de verschillende workloads binnen uw organisatie, beantwoordt u de volgende vraag:
Hoe lang kan een specifieke toepassing/systeem/machine uitgeschakeld zijn zonder een significante impact op de kernactiviteiten van uw organisatie te hebben?
Na het beantwoorden van deze vraag voor verschillende machines, overweeg of de verwachte resultaten voldoen aan uw huidige zakelijke behoeften. Zo niet, bedenk dan hoe u uw back-up en DR-strategieën kunt verbeteren om geback-upte gegevens zo actueel mogelijk te houden.
Hoe u een strakkere RPO en RTO kunt bereiken met NAKIVO
NAKIVO Backup & Replication stelt u in staat om vaker back-ups te maken van virtuele en fysieke machines, wat de RPO verbetert. Plan gewoon regelmatige back-ups in met een interval dat niet langer is dan uw doelstelling.
De oplossing helpt ook de RTO te verminderen met directe virtuele machineherstel en replicatiefunctie voor VMware vSphere, Microsoft Hyper-V en Amazon EC2. Integrateer uw netwerkbeheer diensten en start een herstelproces direct na het onbeschikbaar worden van een virtuele machine. U kunt ook exacte kopieën van kritieke virtuele machines maken op een andere locatie. Als de originele virtuele machine mislukt, worden de kopieën automatisch opgestart. Als het behouden van kopieën meer bronnen vereist dan u kunt betalen, kunt u kiezen voor de directe virtuele machine opstartfunctie uit back-up.
Om de snelste RTO’s te behalen, heeft NAKIVO Backup & Replication de sitecoördinatie voor herstelfunctionaliteit geïntroduceerd. Automatiseer volledig het overgaan en teruggaan van virtuele machines voor verschillende DR-scenario’s en voer non-disruptieve testen uit om te verzekeren dat het herstel binnen de verwachte tijdspanne plaatsvindt.