Explicación de la política de retención de copias de seguridad de GFS

Idealmente, el objetivo de la copia de seguridad es la capacidad de recuperar datos desde cualquier punto en el tiempo. La manera más directa de hacerlo es mantener copias de seguridad periódicas, generalmente diarias. Sin embargo, incluso con técnicas de ahorro de espacio como las copias de seguridad incrementales para siempre, las copias de seguridad sintéticas, la compresión de datos y la deduplicación, este enfoque requiere capacidades de almacenamiento ilimitadas, y apenas cualquier empresa puede permitirse esto. Por eso existen las políticas de retención de copias de seguridad, o esquemas de rotación de copias de seguridad.

¿Qué es la Política de Retención de Copias de Seguridad GFS?

La política de retención de copias de seguridad GFS (Abuelo-Padre-Hijo) persigue dos objetivos: la minimización del espacio de almacenamiento y la maximización de los puntos de recuperación. Simplemente dicho, nuestra tarea es obtener la mayor cantidad de puntos de recuperación utilizando el menor espacio de almacenamiento.

Existen algunos esquemas de rotación de copias de seguridad con diferentes complejidades y eficiencias diferentes. El más simple es el de ‘primero en entrar, primero en salir’ (FIFO). Es simple: cuando el medio de copia de seguridad se queda sin espacio, se elimina la copia de seguridad más antigua y se escribe la nueva en su lugar. El mérito de FIFO es su simplicidad, y su mayor inconveniente son sus límites espaciales, así que con FIFO puedes almacenar un número finito de copias de seguridad. Dependiendo de con qué frecuencia hagas copias de seguridad de tus VM y de qué tan grande sea tu repositorio de copias de seguridad, puedes cubrir con copias de seguridad un intervalo de tiempo relativamente pequeño. Sin embargo, este intervalo de tiempo se cubre por completo.

¿Todas las empresas necesitan una cobertura de respaldo tan detallada? Por supuesto, hay algunas, como las instituciones financieras o gubernamentales, donde incluso una pequeña pérdida de datos puede ser extremadamente costosa. A nadie le gustaría que su cuenta bancaria o seguro social se anulara debido a una falla de hardware en el centro de datos. Es por eso que tales organizaciones gastan mucho dinero en almacenamiento de respaldo, archivos en cinta, y así sucesivamente.

Sin embargo, la mayoría de las empresas no son tan sensibles a la pérdida de datos, por lo que pueden implementar un esquema de rotación de respaldo que no implique el almacenamiento de respaldos diarios durante un año. Esta política de retención de respaldo permite encontrar un equilibrio sensato entre la recuperabilidad de datos y los costos invertidos en la infraestructura de respaldo. Uno de los esquemas más comúnmente utilizados es el de Abuelo-Padre-Hijo (GFS, por sus siglas en inglés).

¿Cómo funciona el esquema de respaldo GFS?

Al igual que en una familia humana, un hijo es el más joven, un padre es más viejo, y un abuelo es el más antiguo. En el mundo de los respaldos, un hijo es el respaldo más reciente desde un momento dado, y un abuelo es el más distante. Por lo general, un hijo es un respaldo diario, un padre es uno semanal, y un abuelo es uno mensual. Sin embargo, se pueden agregar más “parientes” en medio, como respaldos por hora, trimestrales o anuales. Por ejemplo, el sistema operativo macOS de Apple tiene una utilidad de respaldo integrada llamada Time Machine que utiliza un esquema de rotación GFS, donde un hijo es un respaldo del sistema operativo por hora, y un abuelo es uno mensual.

El esquema clásico de GFS implica copias de seguridad diarias como ‘hijos’, semanales como ‘padres’ y mensuales como ‘abuelos’. La copia de seguridad completa inicial realizada el lunes se convierte en el primer ‘padre’, y las copias de seguridad incrementales diarias siguientes son ‘hijos’. La última copia de seguridad de la semana se convierte en el siguiente ‘padre’.

Los ‘hijos’ rotan según el esquema de rotación FIFO, por lo que el ‘hijo’ más antiguo es reemplazado por la nueva copia de seguridad incremental y el ciclo se repite. La última copia de seguridad del mes se convierte en un ‘abuelo’. Después de eso, los ‘padres’ comienzan a rotar según el esquema FIFO.

En la figura a continuación, puedes ver qué copias de seguridad están disponibles al final de junio si comenzamos a respaldar una VM en abril: los elementos azules representan las copias de seguridad disponibles y los grises representan aquellas que no lo están.

Uno de los desventajas del esquema de GFS es que las copias de seguridad más antiguas se vuelven menos granulares. Por ejemplo, si creaste algún archivo, digamos, el lunes de la segunda semana de junio, y luego lo eliminaste al día siguiente, se perderá irremediablemente.

Conclusión

Dependiendo de la política de protección de datos de tu organización, puedes agregar copias de seguridad horarias, trimestrales o anuales al esquema de rotación de GFS. Con otras técnicas de ahorro de espacio como copias de seguridad incrementales para siempre, copias de seguridad sintéticas y compresión y eliminación de duplicados de repositorios de copias de seguridad, proporciona una protección de datos razonable sin gastar una gran cantidad de dinero en la infraestructura de almacenamiento de copias de seguridad.

Source:
https://www.nakivo.com/blog/gfs-retention-policy-explained/