Politica di conservazione del backup GFS spiegata

Idealmente, l’obiettivo del backup è la capacità di recuperare dati da qualsiasi punto nel tempo. Il modo più semplice per farlo è mantenere backup periodici, di solito quotidiani. Tuttavia, anche con tecniche di risparmio di spazio come i backup incrementali infiniti, i backup sintetici, la compressione dei dati e la deduplicazione, questo approccio richiede capacità di archiviazione illimitate, che poche aziende possono permettersi. Ecco perché esistono le politiche di conservazione dei backup, o gli schemi di rotazione dei backup.

Cosa significa la politica di conservazione dei backup GFS?

La politica di conservazione dei backup GFS (Nonno-Padre-Figlio) persegue due obiettivi: la minimizzazione dello spazio di archiviazione e la massimizzazione dei punti di ripristino. Semplicemente detto, il nostro compito è ottenere il maggior numero di punti di ripristino utilizzando il minor spazio di archiviazione possibile.

Ci sono alcuni schemi di rotazione dei backup con complessità e efficienza diverse. Il più semplice è il ‘primo entrato, primo uscito’ (FIFO). È semplice: quando il supporto di backup esaurisce lo spazio, il backup più vecchio viene eliminato e il nuovo viene scritto al suo posto. Il merito del FIFO è la sua semplicità, mentre il suo più grande svantaggio sono i limiti spaziali, quindi con il FIFO è possibile archiviare un numero finito di backup. A seconda di quanto frequentemente si eseguono i backup delle VM e di quanto è grande il repository di backup, è possibile coprire un intervallo di tempo relativamente breve con i backup. Tuttavia, questo intervallo di tempo è coperto completamente.

Hanno bisogno di una copertura di backup testuale tutte le aziende? Naturalmente, ci sono alcune, come le istituzioni finanziarie o governative, dove anche una piccola perdita di dati può essere estremamente costosa. Nessuno gradirebbe se il suo conto bancario o la sua sicurezza sociale fossero annullati a causa di un guasto hardware nel datacenter. Ecco perché tali organizzazioni spendono davvero molti soldi su memorie di backup, archivi su nastro e così via.

Tuttavia, la maggior parte delle aziende non è così estremamente sensibile alla perdita di dati, quindi possono implementare uno schema di rotazione del backup che non implichi lo stoccaggio dei backup giornalieri entro un anno. Tale politica di conservazione dei backup consente di trovare un equilibrio sensato tra la recuperabilità dei dati e i costi spesi per l’infrastruttura di backup. Uno dei più comunemente usati è uno schema di rotazione Grandfather-Father-Son (GFS).

Come funziona lo schema di backup GFS?

Come in una famiglia umana, un figlio è il più giovane, un padre è più anziano e un nonno è il più vecchio. Nel mondo del backup, un figlio è il backup più recente da un dato momento e un nonno è il più distante. Di solito, un figlio è un backup giornaliero, un padre è settimanale e un nonno è mensile. Tuttavia, è possibile aggiungere altri ‘parenti’ in mezzo, come backup orari, trimestrali o annuali. Ad esempio, il sistema operativo macOS di Apple ha un’utilità di backup integrata chiamata Time Machine che utilizza uno schema di rotazione GFS, e un figlio è un backup del sistema operativo orario, mentre un nonno è mensile.

Lo schema classico GFS prevede backup giornalieri come “figli”, settimanali come “padri” e mensili come “nonni”. Il primo backup completo effettuato il lunedì diventa il primo “padre”, mentre i successivi backup incrementali giornalieri diventano “figli”. L’ultimo backup della settimana diventa il prossimo “padre”.

I “figli” vengono ruotati secondo il principio FIFO, quindi il “figlio” più vecchio viene sostituito con il nuovo backup incrementale e il ciclo si ripete. L’ultimo backup del mese diventa un “nonno”. Successivamente, i “padri” iniziano a ruotare secondo il principio FIFO.

Nella figura qui sotto, puoi vedere quali backup sono disponibili alla fine di giugno se abbiamo iniziato a eseguire il backup di una VM ad aprile: gli elementi blu rappresentano i backup disponibili, mentre quelli grigi rappresentano quelli che non lo sono.

Uno degli svantaggi dello schema GFS è che i backup più vecchi diventano meno granulari. Ad esempio, se hai creato un file il lunedì della seconda settimana di giugno e lo hai cancellato il giorno successivo, sarà irrimediabilmente perso.

Conclusioni

In base alla politica di protezione dati della tua organizzazione, puoi aggiungere backup orari, trimestrali o annuali allo schema di rotazione GFS. Utilizzando altre tecniche di risparmio di spazio come i backup incrementali permanenti, i backup sintetici e la compressione e deduplicazione del repository di backup, offre una ragionevole protezione dei dati senza dover spendere una fortuna per l’infrastruttura di archiviazione dei backup.

Source:
https://www.nakivo.com/blog/gfs-retention-policy-explained/