虚拟机复制,或 VM 复制,仍然是最佳数据保护技术之一,可在任何起源的故障或停机期间实现短恢复时间和系统可用性。在灾难情况下,虚拟机副本可以立即启动,让您在几秒内恢复虚拟机并保持关键业务运营。
为了避免在运行虚拟机复制软件时出现可能的陷阱 – 例如应用程序故障和错误、数据丢失、资源消耗过高等 – 请遵循本文介绍的 VMware vSphere 复制最佳实践,作为高效可靠的虚拟机数据保护策略的一部分。
vSphere 复制是什么以及其工作原理
VMware vSphere 复制是在自定义位置创建 VMware vSphere 虚拟机的精确副本的过程,该位置可以是 ESXi 主机或集群。这个虚拟机副本称为 VM 副本,保持处于关闭状态,并定期或连续(持续复制)更新以反映源虚拟机的最新更改和状态。
注意:VMware vSphere 中的复制经常与 VMware 备份混淆,但这些虚拟机数据保护方法追求不同的目标,应该相辅相成而不是相互替代(请参阅我们的博客文章 VM 备份 vs. VM 复制)。
10 个 VMware 数据复制最佳实践
遵循以下最佳实践,并将它们用于 VMware vSphere 复制和其他环境中的虚拟机复制。
1. 确定关键任务工作负载并对其进行优先排列。
确定哪些虚拟机和应用程序数据需要最高的保护和在发生停机或灾难时需要最快的恢复。您无需复制所有内容,并非所有内容都需要在相同的时间范围内恢复。
例如,您的在线商店保持持续运营,并允许与客户进行直接订单和购买交易。如果您的网络服务器故障,网站、库存和CRM将极为关键,需要在第一时间尽快恢复,以最小化网站对客户的停机影响,而后端应用程序可以等待。
2. 概述数据保护计划。
没有计划就是在计划失败。根据业务连续性需求、关键任务工作负载、优先级、个别数据保护技术、虚拟机备份/复制作业频率和持续时间、所需资源(数据存储容量、网络带宽、虚拟机备份/复制窗口等)来规划数据保护活动。
确保您的数据保护计划还涵盖人员责任、专用硬件和软件组件以及灾难恢复场景。
3. 使用适当的虚拟机备份和复制比率。
虽然虚拟机备份和虚拟机复制似乎是在做同样的事情,但它们的目标不同,不能相互替代。无论何种类型,虚拟机备份都是为了长期保存虚拟机数据。而虚
虚拟机复制是数据保护计划的组成部分,您应该找到一种高效的常规虚拟机备份和虚拟机复制的组合,以适应您组织的需求和预算。
4. 建立虚拟机数据复制序列的可衡量标准。
建立可衡量的标准可能有助于决定选择哪种虚拟机复制解决方案。关于VMware vSphere中的复制以实现高可用性,您主要需要考虑两个方面:
- 速度。您需要多快恢复VM数据?虽然虚拟机副本是原始虚拟机的完整副本,但您可能仍然需要一些时间来访问它,例如,通过重新挂载和重新启动数据库管理系统。
- 容错性是系统在一个或多个组件出现故障的情况下保持良好性能水平的能力。考虑您的系统应该达到何种容错程度,以便在灾难发生时使虚拟机数据可用。在决定多久使用虚拟机复制来实现容错性时,还要考虑您的硬件和网络容量。
根据您的业务连续性政策,确定恢复点与故障点之间的最佳接近度,即恢复点目标(RPO),这是在最小化数据丢失和额外资源成本之间进行权衡。对于一些企业,它可能是24小时,7天,甚至一个月,而其他企业可能仅需要RPO为10秒。
5. 准备故障切换和故障恢复路线图。
为了在生产虚拟机出现故障时保持服务和应用程序的最小中断,您应该提前确定故障转移和故障恢复程序。制定生产虚拟机故障转移和故障恢复操作方案,以应对不同的不利情况。
根据建立的数据保护系统,故障转移和故障恢复程序可能是手动的,也可能是自动的,用于计划内和计划外的关闭。
6. 启用虚拟机副本的验证。
定期验证您的虚拟机副本以确保其可用性是一个好的做法。这将防止任何不愉快的惊喜。可能会出现您的虚拟机副本损坏或损坏的情况。无论缺陷的原因是什么,定期验证虚拟机副本,并将验证计划包括在您的计划中。
当使用第三方 VMware vSphere 复制解决方案时,建议您启用虚拟机副本的自动验证功能(如果有此功能)。因此,所有您的虚拟机副本将自动验证完整性。
7. 创建应用程序感知的副本。
现代数据保护解决方案为您提供了一种特殊的应用程序感知复制模式,允许您为应用程序创建应用程序感知的虚拟机副本,例如 Microsoft Active Directory、Microsoft SQL Server、Microsoft SharePoint、Microsoft Exchange Server 或 Oracle Database,依靠 VSS 写入程序。
“应用感知”或者换句话说,应用一致的虚拟机复制模式意味着在复制过程中,内存数据和待处理的I/O操作在快照生成之前被刷新到磁盘上。因此,您的虚拟机副本包含一致的数据,并且应用程序可以顺利恢复,没有数据丢失。
8. 在恢复工具周围构建自动化。
在恢复工具周围构建自动化可以降低不必要的延迟,如果在灾难发生时必须尽快恢复虚拟机。确保自动化脚本得到正确维护。另一方面,现代先进的数据保护解决方案提供集成的自动化功能。
9. 确定保留和轮换策略。
此策略确定创建虚拟机副本的频率及其保留时间。虚拟机复制数据的更改不断添加到复制更改数据库中。如果不定期清除,它将急剧增长,直到消耗所有可用的磁盘空间。这次清除之间的时间称为复制清除延迟。默认的复制清除延迟在您的数据保护软件中设置,并且从一天到多天不等。
在确定保留和轮换策略时,考虑复制清除延迟。超过清除延迟的更改将从复制更改数据库中清除。确保复制更改数据库的备份频率比复制清除延迟周期更高;否则,某些更改可能会丢失。
10. 选择正确的虚拟机复制和灾难恢复解决方案。
如果您需要定期进行虚拟机复制,您应选择合适的解决方案,以满足您的IT基础设施特定需求和您组织的预算。
当比较当前市场上可用的VMware vSphere复制产品时,您应该从功能和性能的角度考虑它们的具体特点。例如,一些产品使用同步虚拟机复制(连续复制),而其他产品则运行半同步或异步虚拟机复制。虽然同步VMware数据复制似乎是处理事务性应用程序故障转移的更好选择,但在慢网络中使用的完全同步可能会严重影响性能。相反,在这种情况下,异步VMware复制几乎不会对性能产生影响。另一方面,如果主服务器失败,异步VMware虚拟机复制可能导致已提交的数据丢失。
另一个要考虑的因素是您的虚拟机复制和恢复操作的速度,因为这可能需要高容量硬件。
虚拟机的远程复制到外部位置或云可保护您的数据,即使整个数据中心遭遇灾难,但请确保您的基础设施网络具有所需的带宽。
使用NAKIVO的VMware vSphere复制。
NAKIVO备份与复制提供了许多有用的功能,使您的VMware复制以及Hyper-V复制甚至AWS EC2实例复制变得简单快捷。NAKIVO解决方案支持VMware变更块跟踪以进行增量复制,提供灵活的保留设置,并直接使用VMware API与主机级别的VMware数据复制进行交互。
您可以使用NAKIVO创建的VMware副本进行VM故障转移和复杂的完整主站点恢复方案。
Source:
https://www.nakivo.com/blog/vmware-replication-best-practices/