Práticas recomendadas de armazenamento Hyper-V

Tutoriais

Hyper-V

Armazenamento é um dos componentes mais importantes envolvidos com servidores; isso inclui servidores de virtualização que têm um hipervisor instalado e máquinas virtuais em execução. O armazenamento pode causar alta ou baixa performance, além de garantir uma alta ou baixa confiabilidade na manutenção dos dados da VM e dos discos virtuais. Diferentes tipos de armazenamento podem ser usados no ambiente virtual do Hyper-V, e o administrador deve fazer a escolha certa antes de configurar um servidor ou implantar máquinas virtuais.

Este post no blog tem como objetivo ajudá-lo a explorar diferentes tipos de opções de armazenamento para fazer uma seleção de armazenamento que seja mais adequada ao seu ambiente e, assim, atenda eficientemente aos seus requisitos.

Recomendações de Armazenamento do Hyper-V

O armazenamento que pode ser montado no servidor Hyper-V pode ser de dois tipos: armazenamento local ou armazenamento remoto.

O armazenamento local consiste em vários discos que estão localmente conectados ao servidor. Esses discos geralmente estão conectados com a interface SAS (Serial Attached SCSI) a um controlador RAID (Redundant Array of Independent Disks) dentro do chassi do servidor. O uso de discos SAS é preferível aos discos SATA (apesar da compatibilidade – os discos SATA podem ser conectados a portas SAS, mas não o contrário) devido ao maior nível de confiabilidade dos discos SAS. O armazenamento local pode ser mais acessível do que o armazenamento remoto. Se você não planeja implantar um cluster Hyper-V, pode usar armazenamento local.

O armazenamento remoto está localizado separadamente do servidor Hyper-V e está conectado ao servidor via protocolos iSCSI, Fibre Channel ou SMB 3.0. Fibre Channel e iSCSI fornecem armazenamento em nível de bloco, enquanto o SMB 3.0 é armazenamento em nível de arquivo. Fibre Channel requer uma interface física especial para conectar servidores ao armazenamento, como SAN (Storage Area Network). FCoE (Fibre Channel over Ethernet) pode ser usado para conectar o armazenamento via redes Ethernet. O protocolo iSCSI pode ser usado para conectar um servidor a SAN ou NAS (Network Attached Storage). O dispositivo NAS se parece com um mini servidor que possui um controlador RAID com slots para unidades de disco interno e diferentes portas para conexão com a rede externa. Um servidor independente também pode ser configurado para ser usado como NAS. SAN e NAS podem garantir redundância de dados para uma melhor confiabilidade.

Ao implantar um Cluster de Failover, o armazenamento remoto compartilhado com todos os nós dentro do cluster deve ser usado. Nesse caso, esse armazenamento é chamado de armazenamento compartilhado.

Use RAID 1 ou RAID 10

RAID é o conjunto redundante de discos independentes. A redundância de dados em seu armazenamento pode proteger seus dados no caso de falha do disco. Existem vários tipos de RAID.

RAID 0 não é redundante e é chamado de striping de disco. Não há tolerância a falhas – a falha de um disco causa falha em todo o array. Aumentar o desempenho pode ser mencionado como um caso de uso (por exemplo, armazenar em cache transmissões ao vivo para a indústria de TV). Um mínimo de 2 discos é necessário para construir esse tipo de RAID.

O RAID 1 é redundante. Todos os blocos em um disco são espelhados em outro disco, assim, é alcançada uma redundância de 100%. Se um dos discos falhar, os dados no segundo disco podem ser acessados e usados para reconstruir o conjunto. A probabilidade de uma reconstrução bem-sucedida do conjunto é alta. O RAID 1 pode ser usado para armazenamento de failover. Um mínimo de 2 discos é necessário para construir esse tipo de RAID.

O RAID 10 é uma combinação de RAID 0 e RAID 1. As vantagens desses dois tipos de conjuntos são usadas, assim o resultado é um conjunto tolerante a falhas com desempenho superior. Os discos espelhados são combinados em uma listra. Um mínimo de 4 discos é necessário para construir esse tipo de RAID. Se o RAID 10 consistir em 4 discos, os dados podem ser protegidos no caso de falha de qualquer disco único. Além disso, o conjunto de 4 discos pode sobreviver se dois discos de espelhos diferentes falharem.

O RAID 5 fornece uma listra com paridade. Os blocos são listrados pelos discos, mas as informações de paridade que podem ser usadas para recuperação também são armazenadas pelos discos. O espaço ocupado pelas informações de paridade é igual à capacidade de um disco. Por exemplo, as informações de paridade ocupam cerca de 25% do espaço para um conjunto de 4 discos. Não é totalmente redundante como o RAID 1. Em teoria, o RAID 5 pode sobreviver se um dos discos falhar. Um mínimo de 3 discos é necessário para construir esse tipo de RAID.

O RAID 6 fornece uma listra com dupla paridade. Isso é semelhante ao conceito de RAID 5, mas as informações de paridade são armazenadas em dois discos em vez de apenas um. O RAID 6 pode sobreviver no caso de falha de até dois discos. Um mínimo de 4 discos é necessário para construir esse tipo de RAID.

À primeira vista, RAID 5 e RAID 6 parecem atraentes, mas vamos dar uma olhada mais de perto. RAID 5 foi desenvolvido dezenas de anos atrás, quando a capacidade dos discos era bastante pequena. No mundo moderno, a capacidade do disco cresce mais rápido do que a velocidade do disco – consequentemente, se um disco falhar, a reconstrução do RAID 5 pode levar muito tempo. A carga de trabalho de cada disco em RAID 5 aumenta significativamente durante uma reconstrução, especialmente se o servidor usar o armazenamento intensivamente para realizar tarefas regulares ao mesmo tempo. Pode haver dados raramente usados nos discos que pertencem ao RAID 5; e você não pode ter certeza de que esses dados podem ser lidos com sucesso. Isso aumenta a probabilidade de erro. Se ocorrer um erro durante a reconstrução do array, então todo o array pode falhar. Quando o RAID 5 tem um disco falhado, este array funciona como RAID 0 e os dados estão em risco.

RAID 6 tem o dobro dos dados de paridade que podem ser usados para recuperação em comparação com o RAID 5. Como resultado, a probabilidade de sobreviver à falha de um disco, bem como a probabilidade de reconstrução bem-sucedida, é maior. RAID 6 tem outro problema – seu desempenho é o mais baixo em comparação com RAID 10 e RAID 5. Problemas de desempenho são especialmente notados durante a reconstrução.

Como pode ser visto, RAID 1 e RAID 10 fornecem a maior confiabilidade, razão pela qual são recomendados para uso no armazenamento do Hyper-V. O RAID de hardware pode ser configurado em um servidor físico ou em um dispositivo NAS.

Faça uso de armazenamento de alta velocidade

O desempenho de entrada/saída de armazenamento tem um impacto significativo em fornecer desempenho suficiente para as VMs. Os discos rígidos mais rápidos (HDD) devem ser usados para armazenar as VMs. Há uma ampla variedade de discos rígidos modernos com características de alto desempenho, que proporcionam alta velocidade por um preço acessível por Gigabyte. Se a velocidade de um disco rígido não for suficiente para suas VMs, você pode usar um Disco de Estado Sólido (SSD). Não há partes móveis em um SSD em comparação com o HDD clássico de rotação, assim um SSD fornece maior velocidade – mas é mais caro. O preço por um Gigabyte para um SSD é maior, e sua capacidade geralmente é menor do que a de um HDD. Ao fazer uso dos discos com o mais alto desempenho para seu armazenamento do Hyper-V, as VMs são capazes de funcionar sem atrasos.

Faça Uso de um Volume Dedicado para Armazenar VMs

Abstenha-se de armazenar VMs em volumes de sistema. O volume do sistema geralmente está ocupado com a leitura ou gravação de arquivos de sistema que são usados pelo sistema operacional (C:\ é sempre um volume de sistema por padrão). Assim, armazenar os arquivos da VM no volume do sistema pode reduzir o desempenho da VM. Outra questão que pode surgir é a de espaço livre insuficiente no volume. Essa situação pode ocorrer quando os arquivos do sistema ocupam todo o espaço em disco livre, ou quando os arquivos da VM, como arquivos de disco virtual, ocupam todo o espaço em disco. Como resultado, as VMs nos quais os arquivos são armazenados dentro de um volume de sistema estão em risco de falha. Além disso, o host do Hyper-V também pode não funcionar corretamente sem espaço livre suficiente para gravar arquivos de sistema. Faça uso de volumes separados para armazenar sistemas operacionais e VMs. Além disso, evite armazenar arquivos de sistema, como arquivos de troca, em unidades que são usadas para dados de VM.

Armazenar arquivos de VM em um local

Alguns dos principais arquivos da máquina virtual Hyper-V são: VHDX (VHD) – arquivos de disco virtual, AVHDX – arquivos de disco virtual de diferença, VMCX – arquivos de configuração e VMRS – arquivos de estado em tempo de execução. Os arquivos da VM podem ser armazenados em diferentes locais padrão que não são convenientes para os administradores. Para evitar isso, especifique um único diretório para armazenar todos os arquivos pertencentes à VM atual. Na captura de tela abaixo, pode-se ver que todos os arquivos pertencentes a uma VM chamada Server2016-01 são armazenados em subdiretórios de um único diretório chamado Server2016-01.

Deixe espaço para arquivos BIN (VMRS)

Os arquivos BIN consomem espaço em disco para armazenar o estado da memória. Para este fim, um espaço reservado deve ser deixado nos volumes onde os arquivos da VM são armazenados. Desde o Hyper-V 2016, a extensão deste tipo de arquivo foi alterada de BIN para VMRS. Este tipo de arquivo ocupa o segundo lugar no consumo de espaço em disco, seguindo os arquivos de disco virtual VHDX. O tamanho de um arquivo BIN (VMRS) é igual ao tamanho da memória virtual da VM. Por exemplo, se sua VM tiver um disco virtual de 30 GB e 8 GB de memória virtual, você deve reservar pelo menos 38 GB em seu armazenamento. Se a memória virtual dinâmica estiver configurada para uma VM, o tamanho do arquivo BIN (VMRS) será igual à quantidade de memória provisionada naquele ponto no tempo.

Qual sistema de arquivos usar: NTFS ou ReFS?

O NTFS (Sistema de Arquivos de Nova Tecnologia) é um sistema de arquivos criado pela Microsoft em 1993 e amplamente utilizado em ambientes Windows nos dias de hoje.

O ReFS (Resilient File System) é o mais novo sistema de arquivos da Microsoft lançado com o Windows Server 2012, que possui melhorias como:

Proteção de dados contra corrupção usando checksums para metadados e arquivos
Integração com espaços de armazenamento
Verificação automática de integridade de dados e correção de erros (se ocorrer um erro)
Tecnologia de clonagem de blocos (útil quando as VMs são clonadas)
Aumento da tolerância contra quedas de energia
Suporte a criptografia com BitLocker
Aumento do tamanho máximo de arquivo e comprimento do nome do arquivo
Aumento do volume máximo
Criação mais rápida de discos virtuais fixos

Como pode ser visto, o sistema de arquivos ReFS tem uma longa lista de vantagens e é projetado para atender aos requisitos de armazenamento do servidor de forma mais eficiente. No entanto, alguns desvantagens também estão presentes:

O Windows não pode ser carregado a partir de um volume ReFS
Compactação de dados, deduplicação baseada em arquivos do Windows, criptografia de arquivos, links rígidos, atributos estendidos, cotas de disco não são suportados
Não pode ser usado para Volumes Compartilhados Clusterizados
Não fornece suporte para nomes de arquivo legados 8.3

Finalmente, a escolha do sistema de arquivos fica a cargo do administrador. É recomendado o uso do ReFS para armazenamento do Hyper-V se as limitações do ReFS não importarem para o seu sistema.

Use uma Rede de Armazenamento de Alta Velocidade

Ao utilizar armazenamento remoto, a conexão de rede é um fator crucial. Se você possui discos de alta velocidade em seu NAS ou SAN, mas uma conexão de rede lenta, o desempenho geral do sistema de armazenamento será degradado. É por isso que é recomendado o uso de uma rede de alta velocidade dedicada com baixa latência. Uma conexão de rede de 10 Gbit é recomendada para garantir uma velocidade aceitável. O uso de equipe de NIC para agregação de largura de banda também é útil.

Evite Armazenar o VM com Controlador de Domínio em Compartilhamento SMB3

Acessar um controlador de domínio é necessário para o compartilhamento SMB 3.0 funcionar corretamente. Se um host com compartilhamento SMB 3.0 ou um host Hyper-V não conseguir acessar o controlador de domínio, uma autenticação não poderá ser passada e uma conexão não poderá ser estabelecida. Nesta situação, um servidor Hyper-V não consegue iniciar um VM com Controlador de Domínio que está colocado em compartilhamento SMB 3.0. Mantenha um VM com Controlador de Domínio no armazenamento local do seu host Hyper-V para evitar esse problema.

Faça uso de Volumes Partilhados de Cluster para Armazenamento em Cluster

Ao implantar um cluster, você deve configurar o armazenamento compartilhado. Quando se usa armazenamento tradicional sem CSV, apenas um nó (host Hyper-V) pode acessar o mesmo disco/LUN ao mesmo tempo. Os Volumes Partilhados de Cluster (CSV) podem resolver esse problema fornecendo acesso simultâneo ao armazenamento para vários nós sem a necessidade de montar novamente os volumes e alterar a propriedade com permissões. Com CSV, você pode ter um sistema de arquivos agrupado em camadas acima do NTFS ou ReFS para o Hyper-V.

Evite o uso de Discos Pass-Through

A pass-through disk is a physical disk (LUN) that is connected to a virtual machine. This type of disk is used as a storage device and is connected directly to the disk controller of a VM. For the first versions of Hyper-V, using pass-through disks helped increase performance. Nowadays, formats of virtual disks are progressive enough – thus, including performance and using pass-through disks does not make sense because of the issues that may occur when using them. You cannot easily move a pass-through disk with a virtual machine, and backup software cannot make a backup of a VM with this disk type on a host level.

Qual tipo de disco virtual preferir – VHD ou VHDX?

O VHD é um formato legado de discos virtuais para máquinas virtuais que foi introduzido em 2003. O VHDX é um formato mais progressivo (lançado com o Windows Server 2012) que possui um limite de capacidade de disco virtual mais alto (até 64TB), suporta blocos de 4KB, possui redimensionamento em tempo real de disco virtual e possui atualização de estrutura de metadados contínua, o que reduz a probabilidade de corrupção de dados causada por perda de energia. Por essa razão, prefira usar discos virtuais VHDX em seu ambiente Hyper-V.

O Uso de Discos Virtuais Fixos e Dinamicamente Expandidos

A fixed virtual disk is a VHDX (VHD) file that consumes all pre-allocated space on storage, despite the amount of space used inside the virtual disk. The advantages of using a fixed virtual disk are that they work faster, no issues may be caused by over-provisioning, and the fragmentation of the VHDX file is the same after creation. The disadvantages of using a fixed virtual disk are that their creation may take a longer time on NTFS volumes, and more space on storage is needed for disk creation.

O disco virtual dinamicamente expandido começa com um tamanho pequeno de alguns kilobytes após a pré-alocação, cresce à medida que são escritos arquivos dentro do disco virtual até atingir o tamanho máximo que foi pré-alocado durante a criação do disco. Um disco dinâmico não pode ser reduzido automaticamente quando os dados no disco desse tipo são excluídos. As vantagens de usar discos dinâmicos são que eles economizam espaço, são rápidos de criar e incluem superprovisionamento. As desvantagens são que os discos dinâmicos são mais lentos que os discos fixos, envolvem maior fragmentação e o superprovisionamento pode causar falta de espaço livre na memória após o crescimento dos discos dinâmicos.

Você pode usar discos virtuais fixos e dinâmicos dependendo de suas necessidades.

Discos Rígidos Virtuais Diferenciais

A differencing virtual hard disk is a virtual disk file (AVHDX or AVHD) that is created in the VM directory with virtual disks after checkpoint creation. The purpose of differencing the virtual disk is storing changes that are written to a parent virtual disk of a VM after creating a checkpoint. A parent virtual disk can be a fixed, dynamic, or differencing disk. When a checkpoint is deleted, the differencing virtual disk that has been created with this checkpoint is merged with a parent virtual disk. Differencing virtual disk can also be created with Hyper-V’s new virtual hard disk wizard. It is important to note that creating a high number of checkpoints causes the creation of growing differencing virtual disks, which results in performance decreases.

Monitoramento da Saúde e Desempenho do Disco

Monitorar regularmente a saúde do disco pode prevenir possíveis danos que podem causar corrupção de dados. Utilize utilitários que possam monitorar os dados S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology) das unidades de disco, incluindo discos que pertencem a RAID. Quanto mais cedo você identificar um disco com problemas, maior a probabilidade de que seus dados estarão seguros. O desempenho do disco também deve ser monitorado para identificar quais discos podem estar sobrecarregados. Isso pode ajudá-lo a decidir redistribuir as VMs com operações intensivas de disco entre outros armazenamentos para otimizar o desempenho geral.

Conclusão

O armazenamento é um componente crucial para servidores, pois os dados que o armazenamento contém são especialmente importantes para a maioria das empresas de TI. A postagem de blog de hoje abordou as melhores práticas de armazenamento para Hyper-V, que podem ajudar a otimizar o desempenho da VM e garantir alta confiabilidade do armazenamento. Das recomendações listadas acima, escolha aquelas que se adequam ao seu ambiente.

Mesmo que você tenha um armazenamento de primeira classe, é importante fazer o backup adequado dos dados da sua VM do Hyper-V. O NAKIVO Backup & Replication pode ajudar a fazer o backup das suas VMs do Hyper-V de maneira mais eficiente.

Source:
https://www.nakivo.com/blog/hyper-v-storage-best-practices/