当灾难发生时——往往是出乎意料的——对您的业务可能造成不可预测的后果。它们可能包括收入损失、业务声誉受损、生产中心被摧毁、服务中断以及与客户的信誉丧失。
为了避免将业务置于危险之中的风险,提前准备一份有效的灾难恢复(DR)计划至关重要。DR计划的主要组成部分之一是备用站点(也称为DR站点),该站点将用于数据存储和在灾难发生时快速恢复。本博客文章讨论了DR站点在恢复过程中的作用以及它们如何改善业务连续性。
什么是灾难恢复站点?
A disaster recovery site is a location used by an organization for restoring its IT infrastructure and business-critical operations when a primary production center is affected by a natural or man-made disaster. Disaster Recovery sites are often built in a remote location so as to ensure that the disaster which has affected the main site will not affect the secondary site as well. Creating a DR site allows an organization to continue conducting operations and delivering services without disruption, until the primary location is restored.
灾难恢复站点的类型
备份站点有三种类型:冷站点、温暖站点和热站点。让我们看看每个站点代表什么,以及它们之间的区别。
冷站点
A cold site is a backup facility with little or no hardware equipment installed. A cold site is essentially an office space with basic utilities such as power, cooling system, air conditioning, and communication equipment, etc. A cold site is the most cost-effective option among the three disaster recovery sites. However, due to the fact that a cold site doesn’t have any pre-installed equipment, it takes a lot of time to properly set it up so as to fully resume business operations. In case of a disaster, an organization would require help from IT personnel to migrate necessary servers and make them functional in order to take on the workload of the primary site.
热站点
A hot site is a backup facility which represents a mirrored copy of the primary production center. A hot site is equipped with all the necessary hardware, software, and network connectivity, which allows you to perform near real-time backup or replication of the critical data. This way the production workload can be failed over to a DR site in a few minutes or hours, thus ensuring minimal downtime and zero data loss. A hot site is expected to be always online and running without disruption so as to ensure data synchronization between the sites.
A hot site is the most expensive option among the three. Thus, it is important to ensure that this type of a DR site is located far enough from the production center. This way you can decrease the possibility of a hot site being affected by the same disaster as the primary site.
温暖站点
A warm site is considered the middle ground between the cold site and the hot site. A warm site is a backup facility that has the network connectivity and the necessary hardware equipment already pre-installed. However, a warm site cannot perform on the same level as the production center because they are not equipped in the same way. Therefore, a warm site has less operational capacity than the primary site. Moreover, data synchronization between the primary and the secondary sites is performed daily or weekly, which can result in minor data loss. A warm site is perfect for organizations which operate with less critical data and can tolerate a short period of downtime. This type of a DR site is the second most expensive option.
以下是灾难恢复站点的主要特点以及它们的比较。
选择DR站点时需要考虑的因素
在创建DR计划时,负责恢复过程的团队应该决定哪种DR站点类型最适合他们的组织。做出这个决定可能非常具有挑战性。正如您所看到的,所有的DR站点类型都有各自独特的优势和劣势,使它们彼此区分开来。时间、预算、业务优先级和位置是将在下文中讨论的最有影响力的因素。
时间
恢复团队应该首先考虑您的组织在恢复运营之前可以容忍的停机时间(恢复时间目标 – RTO),以及可以丢失多少数据(以时间衡量)而不会造成重大损失(恢复点目标 – RPO)。这个因素确定了您的DR站点需要多先进才能按时提供恢复服务。为此,进行业务影响分析,确定适合您组织的RTO和RPO值。
预算
在建立DR站点时,成本问题肯定会被提出。在这种情况下,恢复团队需要计算公司愿意在DR站点上花费多少钱。建立次要站点的过程将会有多昂贵,通常由所需的设备、IT人员数量和可能的维护成本来定义。
请注意,选择成本较低的选项,如冷备用站点,可能在灾难恢复事件中最终适得其反。因此,组织可能会因长时间不活动而造成重大财务损失。此外,短时间内购买和安装所需设备的成本可能非常高。
业务优先事项
值得考虑的下一个因素是业务优先事项。在这种情况下,恢复团队应该确定对组织最关键的功能和流程,并且它们中断会产生什么影响。此外,组织应根据系统组件的关键程度定义系统恢复顺序。决策是基于业务影响分析进行的,该分析确定了在灾难恢复事件中丢失关键数据和服务的后果。
位置
位置的选择主要由数据的敏感程度和重要性、分配的预算大小以及该地区最容易受到的灾害类型决定。如果要确保主站点和辅助站点之间的数据几乎实时同步,那么两个站点应该相对靠近。然而,在这种情况下,灾难可能会同时影响两个位置,使您无法恢复系统。
另一方面,如果站点相距太远,可能会出现数据同步的问题。此外,随后需要雇佣负责维护远程灾难恢复站点的新IT人员,这最终将导致额外成本。
所有上述因素都可以帮助您在DR站点之间做出正确选择。为此,请评估每个DR站点的利弊,并考虑它们与您组织的需求和优先事项的符合程度。
使用NAKIVO备份与复制进行站点恢复
管理DR过程可能是一项非常具有挑战性和资源密集型的任务。为了避免不必要的开销,并确保业务运营的持续可用性,NAKIVO备份与复制开发了内置的站点恢复功能,下文将对其进行讨论。
站点恢复概述
站点恢复专门设计的目的是大大简化DR过程。基本上,站点恢复功能允许您创建站点恢复(SR)工作流程,从而实现整个DR过程的自动化和编排。SR作业可以根据需要特别定制,以服务于您选择的DR场景。由于SR作业的规模和复杂性可能会有所不同,因此它们可用于服务多种不同的目的。因此,站点恢复为您提供了测试SR工作流程的机会,而不会中断主要工作流程,运行计划和紧急的故障转移和故障恢复,以及成功执行数据中心迁移。
使用站点恢复功能,您可以通过按特定顺序安排操作和条件来构建SR工作流程。可用于SR作业的操作和条件包括以下内容:运行或停止虚拟机/实例;故障转移或故障恢复虚拟机/实例;运行或停止作业;运行脚本;等待;附加或分离存储库;检查条件等。您可以使用这些操作创建的SR工作流数量是无限的。
SR工作流可以在两种模式下运行:生产模式(在实际灾难期间使用)或测试模式(用于检查SR作业的状态及其结果)。如果公司基础设施发生变化,NAKIVO备份与复制允许您修改和更新SR作业以反映这些变化。
站点恢复的好处
正如您所见,站点恢复是一个全面而多功能的功能,允许您轻松编排和自动化灾难恢复流程。然而,这只是它提供的许多好处之一。在下面,您可以看到站点恢复功能所具备的其他优势列表。
非中断性测试。测试SR作业很重要,因为它允许您检查其有效性并验证实际结果是否能够达到预期。这样,您就可以确保在实际灾难期间一切都按计划进行。使用NAKIVO备份与复制,您可以在不中断生产环境的情况下按需或按计划运行SR作业测试。此外,当以测试模式运行SR作业时,您有机会建立RTO并查看是否可以达到目标。作业完成后,您可以分析SR工作流及其结果,并相应地更新SR作业。
内置功能。 Site Recovery是由NAKIVO Backup & Replication开发的独有功能,已内置于产品的工具集中。这意味着您不需要购买单独的许可证来使用Site Recovery,因为它已经包含在套装中。因此,NAKIVO Backup & Replication允许您从单一界面管理所有的恢复和数据保护流程。
成本效益。 NAKIVO Backup & Replication是一个经济实惠的解决方案,可以节省时间、精力和金钱。如上所述,Site Recovery是NAKIVO Backup & Replication的内置功能,这意味着除了Site Recovery功能之外,您还可以获得产品的其余集成功能。与大多数竞争对手不同,NAKIVO Backup & Replication提供了经济实惠的每插座许可证;因此,整个DR解决方案只需支付一小部分费用即可获得。
易用性。 NAKIVO Backup & Replication具有简单易用的基于Web的界面,可以让您从任何地方管理数据保护和恢复流程。此外,创建SR作业仅包括五个步骤,可以轻松设置和运行。一旦灾难发生,您只需点击几下即可运行SR作业并恢复您的虚拟基础架构。因此,您不再需要担心手动配置和监视整个DR流程,并确保您的虚拟环境可以安全按时恢复。
结论
任何业务都可能受到意外事件的负面影响。为了避免损失收入、客户甚至生产,务必设计一套全面的灾难恢复计划,以保护您的组织免受可能影响生产环境的任何突发灾害。确保您的数据安全存储,并可以在灾难恢复事件期间轻松恢复,建立符合您业务需求和优先级的灾难恢复站点(冷、热或温)。
NAKIVO 备份与复制可以帮助您从头到尾管理灾难恢复流程。其站点恢复功能允许您构建一个自动化算法,其中包含一系列按特定顺序排列的操作和条件,可根据您的业务需求进行调整,并为各种灾难恢复场景提供服务。正如您所见,站点恢复功能是一个有效的工具,可以显著减少停机时间,实现业务运营的全天候可用性。
Source:
https://www.nakivo.com/blog/overview-disaster-recovery-sites/