RTO vs RPO: 재해 복구를 위한 주요 차이점 이해

튜토리얼

기업들은 재난 발생 시 데이터를 보호하고 비즈니스 연속성을 보장하기 위해 백업에 점 increasingly 의존하고 있습니다. 그러나 기업의 72% 이상이 회복 지점 목표(RPO)와 회복 시간 목표(RTO)와 관련된 IT 회복 기대치를 충족시키지 못할 것으로 추정됩니다.

효율적인 회복 계획을 작성하는 데 도움을 드리기 위해 RTO와 RPO에 대한 완전한 이해를 개발하고 그 차이에 대해 배우는 것이 중요합니다. 이 글에서는 안정적인 재해 복구 전략을 위해 이 두 매개변수에 대해 알아야 할 모든 것을 설명합니다. 재해 발생 후 데이터 손실을 최소화하고 정상적인 비즈니스 운영을 가능한 한 빨리 재개하는 방법을 알아보세요.

RTO는 무엇입니까?

회복 시간 목표(RTO)는 조직이 발생한 중단 사건 이후 허용할 수 있는 최대 다운 타임을 나타냅니다. 다시 말해, RTO는 재난 발생과 영향을 받은 중요한 워크로드의 회복 사이의 기간입니다.

RTO 계산은 일반적으로 재해 복구 계획, 사용 가능한 리소스 및 예산에 따라 달라집니다. IT 인프라가 사용 불가능할 동안에는, 실패한 원인을 파악하고 문제를 해결하기 위한 필요한 조치를 취하는 데 시간이 필요합니다. 그러나 재해 복구 단계를 설정해 놓아야 제품 문제가 해결되는 동안 중요한 시스템과 작업부하에 접근하고 사용할 수 있습니다. RTO는 실패와 백업 또는 복제 작업부하를 통한 시스템 가용성 사이의 시간입니다.

RPO란 무엇인가?

복구 지점 목표(RPO)는 조직이 재난 시 중요한 결과 없이 견딜 수 있는 데이터의 최대량을 나타냅니다. 이 지표는 마지막 백업/복제 과정 이후의 시간/분으로 측정됩니다. 이를 사용하여 데이터 손실을 줄이기 위해 얼마나 자주 데이터 백업과 복제를 생성해야 하는지 결정합니다.

이상적인 상황에서는 백업 또는 복제 작업이 원래 기계가 고장나기 직전에 완료됩니다. 그러나 이것은 실제로는 드문 경우이므로, 마지막으로 성공적으로 생성된 백업과 원래 기계가 고장나는 시점 사이에 차이가 있습니다. 이 시간 동안, VM은 작업을 수행하고 데이터를 저장하고 있었고, 이 데이터는 대부분 손실될 가능성이 높습니다.

재해 복구에서의 RTO와 RPO란 무엇인가?

데이터 보호의 궁극적인 목표는 명확합니다. 무언가 잘못되었을 때 중요한 데이터가 손실되지 않도록하고 조직의 가동 시간 및 가용성에 대한 SLA를 충족할 수 있어야합니다. 그러나 가상 환경의 모든 변경 사항을 재해 복구 (DR) 사이트로 실시간으로 복제하는 것은 상당히 비용이 듭니다. 그래서 일부 데이터를 손실하고 IT 서비스가 중단될 수 있다는 생각을 받아 들여야 합니다. 따라서 귀하의 임무는 그러한 손실과 중단을 최소화하는 것입니다.

RPO와 RTO의 개념을 간단한 다이어그램으로 설명해 보겠습니다.

이 다이어그램은 일반적인 시나리오를 보여줍니다. 가상 머신이 어떤 이유로 인해 충돌합니다. 노란색 선은 RPO를 나타내며, 이는 마지막 백업과 중단 사이의 시간입니다. 주황색 선은 RTO이며 VM을 복원하는 데 필요한 시간을 반영합니다.

RTO와 RPO의 차이

RTO와 RPO를 결정하는 방법을 이해하려면 그들의 차이와 재해 복구 프로세스에서의 역할을 살펴봐야합니다.

평가

RTO 는 주로 재해 발생 시 비즈니스 운영이 재개되기를 기대하는 시간적 기간에 관심이 있습니다. 고려해야 할 사항은 다음과 같습니다:
- 조직의 필요성과 우선 순위를 평가하십시오. 이는 각 조직마다 고유합니다.
- 어떤 애플리케이션이 조직의 생존에 매우 중요한 서비스 및 애플리케이션인지 고려하십시오. 또한 이러한 애플리케이션이 실패할 경우 어떤 결과가 발생할 수 있는지 고려하십시오.
- 각 시스템/애플리케이션을 어떤 순서로 복구해야 하는지 결정하여 최소한의 다운타임 손실로 성공적인 재해 복구를 보장하십시오.
RPO는 조직의 재정 손실에 심각한 피해를 입히지 않고 다운타임 동안 손실될 수 있는 데이터 양에 더 초점을 맞추고 있습니다. 고려해야 할 사항은 다음과 같습니다:
- 백업/복제 빈도 및 최신 VM 백업과 실제 재해 사이에 손실될 수 있는 데이터 양을 확인하십시오.
- 각 워크로드 유형별로 조직이 손실할 수 있는 데이터 양을 고려하십시오.

비용

RTO와 RPO의 주요 차이점은 전자가 비즈니스 구조와 DR 프로세스 전체를 고려하고, 후자는 데이터와 응용 프로그램의 중요성만을 고려한다는 것입니다. 따라서 RTO 값을 충족하는 것은 신속한 복구를 보장하기 위한 요구사항이 매우 어렵고 비용이 많이 들 수 있습니다. 마찬가지로 작은 RPO를 갖는 것은 더 많은 백업을 수행하고 추가적인 회복 지점을 만들어야 하므로 저장 비용이 증가할 수 있습니다.

자동화

RPO 는 데이터와 시스템의 손실에 대한 내구성에 초점을 맞추기 때문에 빈도가 빈번한 데이터 백업을 실행하는 것이 권장됩니다. 현대의 많은 백업 솔루션은 자동 VM 백업을 수행할 수 있도록 허용하여 백업 전략을 효율적으로 설정하고 귀하의 RPO 목표를 최소한의 노력으로 달성할 수 있습니다.
RTO 를 달성하는 것은 DR 이벤트 중에 복구해야 하는 모든 비즈니스 프로세스와 시스템 구성 요소를 관리해야 하는 복잡한 프로세스입니다. 따라서 RTO 목표를 충족하기 위해 전체 DR 프로세스를 시작부터 끝까지 자동화하고 조율하는 것이 권장됩니다.

계산의 용이함

RPO 를 계산하는 것은 간단하며, 이 지표는 恢复 프로세스의 하나의 方面인 데이터만을 涵蓋하기 때문입니다.
RTO 는 datto 조직의 모든 方面을 고려하며, 데이터와 서비스의 중요性, 停擺 비용, DR 활동 투자 등을 포함합니다. RTO를 계산할 때는 다양한 工作中的load과 응용 프로그램을 고려하는 것이 중요하며, 그들은 다양한 恢复 프로세스를 가질 수 있습니다. 사업 连续计画를 기반으로 RTO를 계산하는 것이 좋습니다. 이 计画는 사업에 영향을 줄 수 있는 사업 风险과 脅威를 아우른 것과, 사업 operations를 재개하기 위한 과정을 描述합니다.

datto 조직에서 다양한 load에 적용되는 RTO를 정의하기 위해서는 다음과 같은 질문을 답해야 합니다

특정 application/system/machine가 停摆되어도 사업의 core operations에 유용한 영향을 미치지 않는 시간이 얼마입니까?

이러한 equipments를 대상으로 이 질문을 답했다면, 기대되는 result가 현재의 사업 需求에 만족할 수 있는지 고려하시오. 만족하지 않는다면, 备份 data를 가장 최신으로 유지하기 위해서 备份 및DR 策略을 어떻게 改善할 수 있을지 생각해보시오

NAKIVO로 RPO와 RTO를 깊게 달성하는 방법

NAKIVO Backup & Replication을 사용하면 virtual 및 physical machines의 备份을 더 자주하여 RPO를 改善할 수 있습니다. 목적에 해당하는 간격으로 정기적인 备份을 스케줄러를 사용하여 생성할 수 있습니다.

해결 strategy는 VMware vSphere, Microsoft Hyper-V, Amazon EC2의 즉시 VM 복구와 副本 기능을 통해 RTO를 감소시키는 것도 도와줍니다. 네트워크 모니터링 서비스를 통합하여 VM이 사용 가능하지 않아지면 즉시 복구 프로세스를 켈리할 수 있습니다. critical VM의 로컬 副本(정확한 사본)를 생성할 수 있으며, 원래 VM이 실패하면 replica는 자동으로 켜집니다. 副本을 유지하기 위해 사용 가능한 리소스보다 많은 리소스가 필요하면, バック업から即席 VM 引导 기능을 선택할 수 있습니다.

가장 �hardt RTO를 달성하기 위해 NAKIVO Backup & Replication은 사이트 복구 orkstration 기능을 도입했습니다. 여러 DR 경험을 자동으로 VM 실패 이전과 다시 복구하는 것을 지원하고 예상 시간 안에 복구를 Ensure할 수 있는 무방万吨 검증을 수행할 수 있습니다.

Source:
https://www.nakivo.com/blog/rpo-and-rto-difference/