Política de Retenção de Backup GFS Explicada

Idealmente, o objetivo do backup é a capacidade de recuperar dados de qualquer ponto no passado. A maneira direta de fazer isso é manter backups periódicos, geralmente diários. No entanto, mesmo com técnicas de economia de espaço como backups incrementais para sempre, backups sintéticos, compressão de dados e deduplicação, essa abordagem requer capacidades de armazenamento ilimitadas, e praticamente nenhuma empresa pode arcar com isso. É por isso que existe a política de retenção de backup, ou esquema de rotação de backup.

O que é a Política de Retenção de Backup GFS?

A política de retenção de backup GFS (Avô-Pai-Filho) tem dois objetivos: minimização do espaço de armazenamento e maximização dos pontos de recuperação. Simplificando, nossa tarefa é obter os maiores pontos de recuperação usando o menor espaço de armazenamento.

Há alguns esquemas de rotação de backup com diferentes complexidades e eficiências diferentes. O mais simples é o ‘primeiro a entrar, primeiro a sair’ (FIFO). É simples: quando o meio de backup fica sem espaço, o backup mais antigo é excluído e o novo é gravado em seu lugar. O mérito do FIFO é sua simplicidade, e sua maior desvantagem são seus limites espaciais, assim com FIFO você pode armazenar um número finito de backups. Dependendo de quão frequentemente você faz backup de suas VMs e de quão grande é seu repositório de backup, você pode cobrir com backups um intervalo de tempo relativamente pequeno. No entanto, esse intervalo de tempo é coberto integralmente.

Todas as empresas precisam de uma cobertura de backup tão detalhada? Claro, há algumas, como instituições financeiras ou governamentais, onde até mesmo uma pequena perda de dados pode ser extremamente custosa. Ninguém gostaria que sua conta bancária ou segurança social fosse anulada por causa de uma falha de hardware no datacenter. É por isso que tais organizações gastam muito dinheiro em armazenamento de backup, arquivos em fita e assim por diante.

No entanto, a maioria das empresas não é tão sensível a perdas de dados, então elas podem implementar um esquema de rotação de backup que não implica armazenamento de backups diários durante um ano. Tal política de retenção de backup permite encontrar um equilíbrio sensato entre a recuperabilidade de dados e os custos gastos na infraestrutura de backup. Um dos mais comumente utilizados é o esquema de rotação Avô-Pai-Filho (GFS).

Como funciona o Esquema de Backup GFS?

Assim como em uma família humana, um filho é o mais novo, um pai é mais velho e um avô é o mais antigo. No mundo do backup, um filho é o backup mais recente a partir de um determinado momento, e um avô é o mais distante. Normalmente, um filho é um backup diário, um pai é semanal e um avô é mensal. No entanto, é possível adicionar mais ‘parentes’ no meio, como backups por hora, trimestrais ou anuais. Por exemplo, o macOS da Apple possui uma utilidade de backup integrada chamada Time Machine que usa um esquema de rotação GFS, onde um filho é um backup do sistema operacional por hora e um avô é mensal.

O esquema GFS implica backups diários como ‘filhos’, semanais como ‘pais’ e mensais como ‘avós’. O backup inicial completo feito na segunda-feira se torna o primeiro ‘pai’, e os backups incrementais diários subsequentes são ‘filhos’. O último backup da semana se torna o próximo ‘pai’.

Os ‘filhos’ são rotacionados no esquema FIFO, portanto, o mais antigo ‘filho’ é substituído pelo novo backup incremental, e o ciclo se repete. O último backup do mês se torna um ‘avô’. Após isso, ‘pais’ começam a ser rotacionados pelo esquema FIFO.

Na figura abaixo, você pode ver quais backups estão disponíveis no final de junho se começarmos a fazer backup de uma VM em abril: os itens azuis representam os backups disponíveis e os cinza representam aqueles que não estão.

Uma das desvantagens do esquema GFS é que os backups mais antigos se tornam menos granulares. Por exemplo, se você criou um arquivo, digamos, na segunda-feira da segunda semana de junho, e então o excluiu no dia seguinte, ele será perdido irremediavelmente.

Conclusão
Dependendo da política de proteção de dados da sua organização, você pode adicionar backups horários, trimestrais ou anuais ao esquema de rotação GFS. Com outras técnicas de otimização de espaço, como backups incrementais permanentes, backups sintéticos e compressão e deduplicação do repositório de backup, ele fornece proteção de dados razoável sem gastar muito dinheiro em infraestrutura de armazenamento de backup.

Source:
https://www.nakivo.com/blog/gfs-retention-policy-explained/