Лучшие практики репликации VMware vSphere

VMware

Репликация виртуальных машин, или репликация ВМ, остаётся одним из лучших методов защиты данных для краткосрочного восстановления и обеспечения доступности системы в случае сбоев или простоев любого происхождения. ВМ-реплика может быть мгновенно запущена в случае катастрофы, позволяя восстановить ВМ в течение секунд и поддерживать важные бизнес-операции.

Чтобы избежать возможных проблем при использовании программного обеспечения для репликации ВМ, таких как сбои приложений и ошибки, потеря данных, недостаточно высокое потребление ресурсов и т. д., следуйте лучшим практикам репликации VMware vSphere, рассмотренным в этом посте как часть эффективной и надежной стратегии защиты данных ВМ.

Что такое репликация vSphere и как она работает

Репликация VMware vSphere – это процесс создания точной копии ВМ VMware vSphere в пользовательском местоположении, которым может быть хост ESXi или кластер. Эта копия ВМ, называемая репликой ВМ, поддерживается в выключенном состоянии и периодически или непрерывно обновляется (непрерывная репликация), чтобы отражать последние изменения и состояние исходной ВМ.

Примечание: Репликация в VMware vSphere часто путается с резервным копированием VMware, но эти методы защиты данных ВМ имеют разные цели и должны дополнять друг друга, а не заменять (см. наш блог-пост Резервное копирование ВМ против репликации ВМ).

10 лучших практик репликации данных VMware

Следуйте приведенным ниже лучшим практикам и используйте их для репликации VMware vSphere и виртуальных машин в других средах.1. Определите миссионерские рабочие нагрузки и приоритизируйте их.

1. Определите критически важные рабочие нагрузки и установите их приоритет.

Определите, какие виртуальные машины и данные приложений требуют наивысшей защиты и наиболее быстрого восстановления в случае простоя или катастрофы. Вам не нужно реплицировать все, и не все необходимо восстанавливать в одинаковые сроки.

Например, ваш интернет-магазин поддерживает непрерывную работу и позволяет проводить прямые заказы и покупки с клиентами. В случае отказа вашего веб-сервера, веб-сайт, инвентарь и CRM будут крайне важны для восстановления в первую очередь и как можно скорее, чтобы минимизировать влияние простоя веб-сайта на клиентов, в то время как прикладные программы для офиса могут подождать.

2. Опишите план защиты данных.

Не планировать — значит планировать провал. Планируйте действия по защите данных с учетом требований бизнес-непрерывности, критически важных рабочих нагрузок, приоритетов, индивидуальных техник защиты данных, частоты и продолжительности резервного копирования/репликации виртуальных машин, необходимых ресурсов (емкость хранения данных, пропускная способность сети, окна для резервного копирования/репликации виртуальных машин и т. д.).

Убедитесь, что ваш план защиты данных также охватывает ответственность персонала, выделенные аппаратные и программные компоненты, а также сценарии восстановления после катастрофы.

3. Используйте правильное соотношение резервного копирования и репликации виртуальных машин.

Хотя резервное копирование и репликация виртуальных машин кажутся делающими одно и то же, у них разные цели и не могут заменять друг друга. Резервное копирование виртуальных машин, каково бы ни было его тип, предназначено для долгосрочного сохранения данных виртуальных машин. В то время как репликация виртуальных машин обеспечивает быстрое восстановление виртуальных машин, или другими словами, высокую доступность виртуальных машин.

Виртуальное реплицирование машины является составной частью плана защиты данных, и вам следует найти эффективное сочетание регулярных резервных копий ВМ и репликации ВМ, чтобы соответствовать потребностям и бюджету вашей организации.

4. Установите измеримые критерии для последовательностей репликации данных ВМ.

Установка измеримых критериев может быть полезной при принятии решения о выборе решения по репликации ВМ. Что касается репликации в VMware vSphere для обеспечения высокой доступности, в основном вам нужно учитывать два аспекта:

Скорость. Насколько быстро вам нужно восстановить данные ВМ? Хотя реплика ВМ является полной копией исходной ВМ, вам все равно может потребоваться некоторое время для доступа к ней, например, путем повторного монтирования и восстановления СУБД.
Отказоустойчивость – это способность системы поддерживать хороший уровень производительности в случае отказа одного или нескольких компонентов. Учитывайте, какой уровень отказоустойчивости должна достигать ваша система, чтобы данные ВМ были доступны в случае катастрофы. При принятии решения о том, как часто вы будете использовать репликацию виртуальной машины для обеспечения отказоустойчивости, также учитывайте возможности вашего аппаратного обеспечения и сети.

В зависимости от вашей политики непрерывности бизнеса установите оптимальную близость точки восстановления к точке отказа, то есть целевой объект восстановления (RPO), который является компромиссом между минимизацией потерь данных и стоимостью дополнительных ресурсов. Для некоторых компаний это может быть 24 часа, 7 дней или даже 1 месяц, в то время как другие могут потребовать, чтобы RPO составлял всего 10 секунд.

5. Подготовьте план аварийного восстановления и возврата к предыдущему состоянию.

Чтобы сохранить работоспособность сервисов и приложений при минимальных нарушениях в случае отключения производственной виртуальной машины, вам следует заранее определить процедуры переключения и возврата в работу. Разработайте сценарии действий по переключению и возврату в работу производственной виртуальной машины для различных неблагоприятных обстоятельств.

В зависимости от установленной системы защиты данных процедуры переключения и возврата в работу могут быть как ручными, так и автоматизированными как для неожиданных, так и для плановых отключений.

6. Включите проверку реплик виртуальных машин.

Регулярная проверка ваших реплик виртуальных машин для обеспечения их пригодности является хорошей практикой. Это поможет избежать неприятных сюрпризов. Может случиться так, что ваша реплика виртуальной машины окажется поврежденной или испорченной. Какова бы причина дефекта ни была, периодически проверяйте реплики виртуальных машин и включайте график проверки в свой план.

При использовании сторонних решений по репликации VMware vSphere рекомендуется включить функцию автоматической проверки реплик виртуальных машин, если такая функция доступна. Таким образом, все ваши реплики виртуальных машин будут автоматически проверены на целостность.

7. Создайте реплики, осведомленные о приложениях.

Современные решения по защите данных предоставляют вам специальный режим репликации, осведомленный о приложениях, позволяющий создавать реплики виртуальных машин, осведомленные о приложениях, для приложений, таких как Microsoft Active Directory, Microsoft SQL Server, Microsoft SharePoint, Microsoft Exchange Server или Oracle Database, полагаясь на писателей VSS.

“Application-aware” или, другими словами, режим репликации виртуальных машин с учетом приложений означает, что в процессе репликации данные из памяти и ожидающие операции ввода-вывода сбрасываются на диск перед созданием снимка. Следовательно, ваши реплики виртуальных машин содержат согласованные данные, и приложения могут быть восстановлены плавно, без потери данных.

8. Автоматизируйте процесс вокруг инструментов восстановления.

Автоматизация процесса вокруг инструментов восстановления сокращает ненужные задержки, если вам необходимо как можно быстрее восстановить виртуальные машины в случае бедствия. Убедитесь, что автоматические сценарии правильно поддерживаются. С другой стороны, современные продвинутые решения по защите данных предлагают интегрированные функции автоматизации.

9. Определите политику удержания и вращения.

Эта политика устанавливает частоту создания реплик виртуальных машин и их время удержания. Данные о репликации виртуальных машин непрерывно добавляются в базу данных изменений репликации. Без ее периодической очистки она быстро увеличивалась бы до тех пор, пока не заняла бы всё доступное дисковое пространство. Этот период между очистками репликации называется задержкой очистки репликации. Значение задержки очистки репликации по умолчанию устанавливается в вашем программном обеспечении для защиты данных и варьируется от одного до нескольких дней.

При установлении политики удержания и вращения учитывайте задержку очистки репликации. Изменения, старше этой задержки, удаляются из базы данных изменений репликации. Убедитесь, что база данных изменений репликации регулярно резервируется чаще, чем период задержки очистки репликации; в противном случае некоторые изменения могут быть потеряны.

10. Выберите правильное решение по репликации виртуальных машин и восстановлению после отказа (DR).

Если вам нужно регулярно выполнять репликацию виртуальных машин, вам следует выбрать подходящее решение, которое соответствует специфическим потребностям вашей IT-инфраструктуры и бюджету вашей организации.

При сравнении продуктов по репликации VMware vSphere, доступных на рынке, следует учитывать их специфические особенности с точки зрения функциональности и производительности. Например, некоторые продукты используют синхронную репликацию VM (непрерывную репликацию), в то время как другие выполняют полусинхронную или асинхронную репликацию VM. В то время как синхронная репликация данных VMware кажется более предпочтительным выбором для аварийного восстановления транзакционных приложений, полная синхронизация при медленной сети может существенно снизить производительность. В отличие от этого, асинхронная репликация VMware практически не влияет на производительность в такой ситуации. С другой стороны, если основной сервер выходит из строя, асинхронная репликация VM VMware может привести к потере данных, зафиксированных.

Еще одним важным аспектом, который следует учесть, является скорость репликации ваших VM и операции восстановления, поскольку это может потребовать высокопроизводительного оборудования.

В то время как удаленная репликация виртуальных машин в офисное или облачное хранилище обеспечивает сохранность ваших данных, даже если происходит катастрофа в вашем центре обработки данных, убедитесь, что сеть вашей инфраструктуры имеет необходимую пропускную способность.

Репликация VMware vSphere с использованием NAKIVO

NAKIVO Backup & Replication предлагает множество полезных функций для упрощения репликации VMware, а также репликации Hyper-V и даже репликации экземпляров AWS EC2 простым и быстрым. Решение NAKIVO поддерживает отслеживание изменений блоков VMware для инкрементальной репликации, предоставляет гибкие настройки удержания и работает напрямую с API VMware для репликации данных VMware на уровне хоста.

Вы можете использовать реплики VMware, созданные с помощью NAKIVO, для аварийного восстановления ВМ и сложных сценариев полного восстановления основного сайта.

Source:
https://www.nakivo.com/blog/vmware-replication-best-practices/