A replicação de máquinas virtuais, ou replicação de VM, continua sendo uma das melhores técnicas de proteção de dados para tempos de recuperação curtos e disponibilidade do sistema durante falhas ou períodos de inatividade de qualquer origem. Uma réplica de VM pode ser ligada instantaneamente em caso de desastre, permitindo que você recupere uma VM em questão de segundos e mantenha as operações comerciais essenciais.
Para evitar possíveis armadilhas ao executar software de replicação de VM – como falhas e erros de aplicativo, perda de dados, consumo inadequadamente alto de recursos, etc. – siga as melhores práticas de replicação do VMware vSphere cobertas neste post como parte de uma estratégia eficiente e confiável de proteção de dados de VM.
O que é a Replicação do vSphere e Como Funciona
A replicação do VMware vSphere é o processo de criar uma cópia exata de uma VM do VMware vSphere em um local personalizado, que pode ser um host ESXi ou cluster. Essa cópia da VM, chamada de réplica de VM, é mantida em estado desligado e atualizada periodicamente ou continuamente (replicação contínua) para refletir as últimas alterações e o estado da VM de origem.
Observação: A replicação no VMware vSphere muitas vezes é confundida com o backup do VMware, mas esses métodos de proteção de dados de VM perseguem objetivos diferentes e devem complementar, não substituir um ao outro (consulte nosso post no blog Backup de VM vs. Replicação de VM).
10 Melhores Práticas de Replicação de Dados da VMware
Siga as melhores práticas abaixo e use-as para replicação de VMware vSphere e replicação de máquinas virtuais em outros ambientes.
1. Defina cargas de trabalho críticas para a missão e priorize-as.
Determine quais máquinas virtuais e dados de aplicativos requerem a maior proteção e a recuperação mais rápida em caso de tempo de inatividade ou desastre. Você não precisa replicar tudo, e nem tudo precisa ser recuperado dentro do mesmo período de tempo.
Por exemplo, sua loja online mantém operação contínua e permite a realização de pedidos diretos e transações de compra com os clientes. Caso seu servidor web falhe, o site, o inventário e o CRM serão extremamente críticos para serem recuperados em primeiro lugar e o mais rápido possível para minimizar o efeito da inatividade do site para os clientes, enquanto os aplicativos de back-office podem esperar.
2. Esboce o plano de proteção de dados.
Não planejar é planejar para falhar. Planeje as atividades de proteção de dados com relação às demandas de continuidade dos negócios, cargas de trabalho críticas para a missão, prioridades, técnicas individuais de proteção de dados, frequência e duração do trabalho de backup/replicação de VM, recursos necessários (capacidade de armazenamento de dados, largura de banda de rede, janelas de backup/replicação de VM, etc.).
Certifique-se de que seu plano de proteção de dados também cubra responsabilidades pessoais, componentes de hardware e software dedicados e cenários de recuperação de desastres.
3. Use uma proporção adequada de backup e replicação de VM.
Embora o backup de VM e a replicação de VM pareçam fazer a mesma coisa, eles têm objetivos diferentes e não podem se substituir. O backup de VM, seja qual for o tipo, é projetado para a preservação segura a longo prazo dos dados da VM. Enquanto a replicação de VM proporciona uma recuperação rápida da VM, ou em outras palavras, alta disponibilidade da VM.
A replicação de máquinas virtuais é um elemento constituinte de um plano de proteção de dados, e você deve encontrar uma combinação eficiente de backups regulares de VM e replicação de VM para atender às necessidades e ao orçamento da sua organização.
4. Estabeleça critérios mensuráveis para as sequências de replicação de dados de VM.
Estabelecer critérios mensuráveis pode ajudar na decisão sobre qual solução de replicação de VM escolher. Em relação à replicação no VMware vSphere para alta disponibilidade, você precisa considerar principalmente dois aspectos:
- Velocidade. Quão rápido você precisa que a recuperação de dados de VM aconteça? Embora uma réplica de VM seja uma cópia completa da VM original, você ainda pode precisar de algum tempo para acessá-la, por exemplo, remontando e restaurando um SGBD.
- Tolerância a falhas é a capacidade de um sistema de manter um bom nível de desempenho no caso de falha de um ou mais componentes. Considere qual grau de tolerância a falhas seu sistema deve alcançar para tornar os dados da VM disponíveis no caso de um desastre. Ao decidir com que frequência você vai empregar a replicação de máquinas virtuais para tolerância a falhas, leve também em conta a capacidade do seu hardware e da rede.
Dependendo da sua política de continuidade de negócios, estabeleça a proximidade ideal do ponto de recuperação com o ponto de falha, ou seja, o objetivo do ponto de recuperação (RPO), que é um equilíbrio entre minimizar a perda de dados e o custo de recursos adicionais. Para algumas empresas, pode ser de 24 horas, 7 dias ou até 1 mês, enquanto outras podem precisar que o RPO seja de apenas 10 segundos.
5. Prepare o plano de failover e failback.
Para manter os serviços e aplicações em funcionamento com o mínimo de interrupção no caso de uma VM de produção falhar, você deve determinar os procedimentos de failover e failback antecipadamente. Elabore cenários de ação para failover e failback de VM de produção a serem seguidos em diferentes circunstâncias adversas.
Dependendo do sistema de proteção de dados estabelecido, os procedimentos de failover e failback podem ser manuais ou automatizados tanto para desligamentos não planejados quanto planejados.
6. Habilitar verificação de réplicas de VM.
A verificação regular das réplicas de VM para garantir que elas sejam utilizáveis é uma boa prática. Isso evitará surpresas desagradáveis. Pode acontecer que sua réplica de VM esteja danificada ou corrompida. Qualquer que seja a razão do defeito, verifique as réplicas de VM periodicamente e inclua a programação de verificação em seu plano.
Ao utilizar soluções de replicação VMware vSphere de terceiros, é recomendável que você habilite o recurso de verificação automática de réplicas de VM, se esse recurso estiver disponível. Assim, todas as suas réplicas de VM serão verificadas automaticamente quanto à integridade.
7. Criar réplicas conscientes de aplicativos.
As soluções modernas de proteção de dados fornecem um modo especial de replicação consciente de aplicativos que permite criar réplicas de VM conscientes de aplicativos para aplicativos como Microsoft Active Directory, Microsoft SQL Server, Microsoft SharePoint, Microsoft Exchange Server ou Oracle Database, confiando em escritores VSS.
“Consciente da aplicação” ou, em outras palavras, o modo de replicação de VM consistente com a aplicação significa que no processo de replicação, os dados em memória e as operações de I/O pendentes são gravados no disco antes que um snapshot seja feito. Consequentemente, suas réplicas de VM contêm dados consistentes, e as aplicações podem ser recuperadas suavemente, sem perda de dados.
8. Construa automação em torno das ferramentas de recuperação.
Automatizar as ferramentas de recuperação reduz atrasos desnecessários se você precisar restaurar VMs o mais rápido possível em caso de desastre. Certifique-se de que os scripts automáticos estejam devidamente mantidos. Por outro lado, soluções modernas avançadas de proteção de dados oferecem recursos de automação integrados.
9. Determine a política de retenção e rotação.
Esta política estabelece a frequência de criação de réplicas de VM e seu tempo de retenção. As mudanças nos dados de replicação da VM são continuamente adicionadas ao banco de dados de mudanças de replicação. Sem sua purga periódica, ele cresceria dramaticamente, até consumir todo o espaço em disco disponível. Este período entre purgas é chamado de atraso de purga de replicação. O atraso de purga de replicação padrão é definido em seu software de proteção de dados e varia de um a vários dias.
Ao estabelecer a política de retenção e rotação, leve em consideração o atraso de purga de replicação. As mudanças mais antigas que o atraso de purga são removidas do banco de dados de mudanças de replicação. Certifique-se de que o banco de dados de mudanças de replicação seja copiado com mais frequência do que o período de atraso de purga de replicação; caso contrário, algumas mudanças podem ser perdidas.
10. Escolha a solução certa de replicação de VM e DR.
Se você precisa realizar regularmente a replicação de máquinas virtuais, deve selecionar a solução adequada que atenda às necessidades específicas de sua infraestrutura de TI e ao orçamento de sua organização.
Ao comparar os produtos de replicação VMware vSphere atualmente disponíveis no mercado, você deve considerar suas características específicas sob a perspectiva tanto de funcionalidade quanto de desempenho. Por exemplo, alguns produtos utilizam a replicação VM síncrona (replicação contínua), enquanto outros executam replicação VM semi-síncrona ou assíncrona. Embora a replicação de dados VMware síncrona pareça ser uma escolha melhor para a failover de aplicativos transacionais, a sincronização completa usada em uma rede lenta pode reduzir criticamente o desempenho. Em contraste, a replicação VMware assíncrona quase não tem impacto no desempenho nessa situação. Por outro lado, se o servidor primário falhar, a replicação de VM VMware assíncrona pode resultar na perda de dados comprometidos.
Outro ponto a se considerar é a velocidade de sua operação de replicação e restauração de VMs, pois pode exigir hardware de alta capacidade.
Enquanto a replicação remota de máquinas virtuais para um local externo ou uma nuvem mantém seus dados seguros, mesmo se um desastre atingir todo o seu datacenter, certifique-se de que a rede de sua infraestrutura tenha a largura de banda necessária.
Replicação VMware vSphere com NAKIVO
O NAKIVO Backup & Replication oferece muitos recursos úteis para tornar a replicação do VMware, bem como a replicação do Hyper-V e até mesmo a replicação de instâncias do AWS EC2 simples e rápida. A solução NAKIVO suporta o rastreamento de blocos alterados do VMware para replicação incremental, fornece configurações de retenção flexíveis e funciona diretamente com as APIs do VMware para replicação de dados do VMware no nível do host.
Você pode usar as réplicas do VMware criadas com o NAKIVO para failover de VM e cenários complexos de recuperação completa do site primário.
Source:
https://www.nakivo.com/blog/vmware-replication-best-practices/