Política de Retenção de Backup GFS Explicada

Idealmente, o objetivo do backup é a capacidade de recuperar dados de qualquer ponto no passado. A maneira direta de fazer isso é manter backups periódicos, geralmente diários. No entanto, mesmo com técnicas de economia de espaço como backups incrementais-para-sempre, backups sintéticos, compressão de dados e deduplicação, essa abordagem requer capacidades de armazenamento ilimitadas, e praticamente nenhuma empresa pode arcar com isso. É por isso que existem política de retenção de backup, ou esquema de rotação de backup.

O que é a Política de Retenção de Backup GFS?

A política de retenção de backup GFS (Avô-Pai-Filho) busca dois objetivos: a minimização do espaço de armazenamento e a maximização dos pontos de recuperação. Simplificando, nossa tarefa é obter a maioria dos pontos de recuperação usando o menor espaço de armazenamento possível.

Há alguns esquemas de rotação de backup com diferentes complexidades e eficiências. O mais simples é o ‘primeiro a entrar, primeiro a sair’ (FIFO). É simples: quando o meio de backup fica sem espaço, o backup mais antigo é deletado, e o novo é escrito em seu lugar. O mérito do FIFO é a sua simplicidade, e sua maior desvantagem são os limites espaciais, portanto com o FIFO você pode armazenar um número finito de backups. Dependendo de com que frequência você faz backup de suas VMs e quão grande é seu repositório de backup, você pode cobrir com backups um intervalo de tempo relativamente pequeno. No entanto, esse intervalo de tempo é coberto por completo.

Todas as empresas precisam de cobertura de backup verbatim? Claro, há algumas, como instituições financeiras ou governamentais, onde até mesmo uma pequena perda de dados pode ser extremamente custosa. Ninguém gostaria se sua conta bancária ou seguro social fosse anulado por causa de uma falha de hardware no datacenter. É por isso que tais organizações gastam muito dinheiro em armazenamento de backup, arquivos em fita e assim por diante.

No entanto, a maioria das empresas não é tão sensível a perdas de dados, então elas podem implementar um esquema de rotação de backup que não implica o armazenamento de backups diários dentro de um ano. Essa política de retenção de backup permite encontrar um equilíbrio sensato entre a recuperabilidade de dados e os custos gastos na infraestrutura de backup. Um dos mais comumente usados é um esquema de rotação do tipo Avô-Pai-Filho (GFS).

Como funciona o Esquema de Backup GFS?

Assim como em uma família humana, um filho é o mais jovem, um pai é mais velho e um avô é o mais velho de todos. No mundo do backup, um filho é o backup mais recente de um momento dado, e um avô é o mais distante. Normalmente, um filho é um backup diário, um pai é semanal e um avô é mensal. No entanto, você pode adicionar mais ‘parentes’ no meio, como backups horários, trimestrais ou anuais. Por exemplo, o macOS da Apple possui um utilitário de backup integrado chamado Time Machine que utiliza um esquema de rotação GFS, onde um filho é um backup do sistema operacional a cada hora, e um avô é mensal.

O esquema clássico do GFS implica backups diários como “filhos”, backups semanais como “pais” e backups mensais como “avós”. O primeiro backup completo realizado na segunda-feira torna-se o primeiro “pai”, e os backups incrementais diários seguintes são “filhos”. O último backup da semana se torna o próximo “pai”.

“Filhos” são rotacionados no esquema FIFO, então o filho mais velho é substituído pelo novo backup incremental, e o ciclo se repete. O último backup do mês se torna um “avô”. Depois disso, os “pais” começam a ser rotacionados pelo esquema FIFO.

Na figura abaixo, você pode ver quais backups estão disponíveis no final de junho, se começamos a fazer backup de uma VM em abril: os itens azuis representam os backups disponíveis e os itens cinza representam os que não estão.

Uma desvantagem do esquema GFS é que os backups mais antigos ficam menos granulares. Por exemplo, se você criou um arquivo na segunda-feira da segunda semana de junho e o excluiu no dia seguinte, ele será perdido de forma irreversível.

Conclusão

Dependendo da política de proteção de dados da sua organização, você pode adicionar backups horários, trimestrais ou anuais ao esquema de rotação GFS. Com outras técnicas de economia de espaço, como backups incrementais “para sempre”, backups sintéticos, compressão e deduplicação do repositório de backup, ele fornece proteção de dados razoável sem gastar uma fortuna em infraestrutura de armazenamento de backup.

Source:
https://www.nakivo.com/blog/gfs-retention-policy-explained/