מדיניות שמירת הגיבויים של GFS מוסברת

באופן אידיאלי, המטרה של גיבוי היא היכולת לשחזר נתונים מכל נקודה בזמן. הדרך הישירה לעשות זאת היא לשמור גיבויים תקופתיים, כלומר בדרך כלל יומיים. אולם, גם עם טכניקות חסכון בשטח כמו גיבויים forever-incremental, גיבויים סינתטיים, דחיסת נתונים והפחתת חפיפות, גישה זו דורשת קיבולת אחסון ללא הגבלה וכמעט אף חברה לא יכולה להרשות לעצמה דבר כזה. זו הסיבה שמדיניות השמירה על הגיבוי או מערכת סיבובי הגיבוי קיימות.

מהו מדיניות השמירה על גיבוי GFS?

מדיניות השמירה על הגיבוי GFS (Grandfather-Father-Son) מתרדף שני מטרות: הקיטול בשטח אחסון והמקסימיזציה של נקודות השחזור. בפשטות, המשימה שלנו היא לקבל את מספר הנקודות לשחזור המרבי באמצעות השימוש בשטח אחסון הכי קטן.

ישנן מספר תוכניות סיבובי הגיבוי עם רמות קושי ויעילות שונה. הפשוטה ביותר היא 'תחילה בתוך, תחילה החוצה' (FIFO). זו פשוטה: כשאחסון הגיבוי מוחלש, הגיבוי הכי ישן נמחק והחדש נכתב במקומו. היתרון של FIFO הוא פשטותו והחסרון הכי גדול שלו הוא הגבולות המרחביים שלו, ולכן עם FIFO ניתן לאחסן מספר סופי של גיבויים. תלוי בכמה פעמים אתה מבצע גיבויים של מכונות וירטואליות שלך וכמה גדולה המאגר של הגיבוי שלך, אתה יכול לכסות טווח זמן יחסית קטן יחסית. אולם, טווח זמן זה מכוסה במלואו.

האם כל החברות צריכות כיסוי גיבוי מילולי כזה? כמובן, ישנם חלקם, כמו מוסדות פיננסיים או ממשלתיים, שבהם אובדן מידע גם קטן יכול להיות יקר מאוד. אף אחד לא ירצה אם חשבונו בנקאי או תעודת הזהות שלו תתמחק בגלל כשל בחומרה במרכז הנתונים. לכן, ארגונים כאלה משקיעים סכומים גדולים באחסון גיבוי, ארכיוני סרט וכדומה.

עם זאת, רוב העסקים אינם כל כך רגישים לאובדן מידע, ולכן הם יכולים ליישם תוכנית סיבוב גיבוי שאינה כוללת אחסון של גיבויים יומיים במשך שנה. מדיניות שמירת הגיבוי הזו מאפשרת מציאת איזון סנפטי בין יכולת השחזור של המידע וההוצאות על התשתית לגיבוי. אחת התוכניות הנפוצות ביותר היא תוכנית סיבוב גדול-אב-בן (GFS).

איך עובדת תכנית הגיבוי GFS?

כמו במשפחה אנושית, הבן הוא הצעיר ביותר, האב הוא זקן יותר, והסבא הוא הכי זקן. בעולם הגיבויים, הבן הוא הגיבוי האחרון מרגע נתון, והסבא הוא הרחוק ביותר. כללית, הבן הוא גיבוי יומי, האב הוא גיבוי שבועי, והסבא הוא גיבוי חודשי. עם זאת, ניתן להוסיף 'קרובים' נוספים ביניהם, כמו גיבויים בשעתיים, רבעוניים או שנתיים. לדוגמה, ב-MacOS של Apple קיים כלי גיבוי מובנה בשם "Time Machine" שמשתמש בתכנית סיבוב GFS, כאשר הבן הוא גיבוי מערכת שעתי, והסבא הוא גיבוי חודשי.

התוכנית הקלאסית של GFS מניחה גיבויים יומיים כ"בנים", שבועיים כ"אבות" וחודשיים כ"סבות". הגיבוי המלא הראשוני שנעשה ביום שני הופך להיות ה"אב הראשון", והגיבויים היומיים הבאים הם "בנים". הגיבוי האחרון של השבוע מהווה את ה"אב הבא".

ה"בנים" מוחלפים על פי סדר FIFO, כלומר הבן הכי ישן מוחלף בגיבוי הבא, והמחזור חוזר. הגיבוי האחרון של החודש הופך להיות "סב". לאחר מכן, ה"אבות" מתחילים להחלף על פי סדר FIFO.

באיור למטה, אפשר לראות אילו גיבויים זמינים עד סוף יוני אם התחלנו לגבות מכונת וירטואלית באפריל: הפריטים הכחולים מייצגים את הגיבויים הזמינים והאפורים מייצגים את אלו שאינם.

אחת מחסרונות התוכנית של GFS הוא שהגיבויים הישנים מתחלשים באיכות. למשל, אם יצרת קובץ מסוים ביום שני בשבוע השני של יוני, ואז מחקת אותו ביום הבא, הוא ייבוש באופן בלתי הפיך.

סיכום

בהתאם למדיניות הגנת הנתונים של הארגון שלך, ניתן להוסיף גיבויים שעתיים, רבעוניים או שנתיים לתוכנית הסיבוב של GFS. עם טכניקות אחסון חסכוניות נוספות כמו גיבויים תוספים לנצח, גיבויים סינתטיים, ודחיסת מאגר גיבויים והפחתת כפילויות, הגנת הנתונים מוצגת בצורה סבירה מבלי להוציא כמויות רבות של כסף על תשתיות לאחסון גיבויים.

Source:
https://www.nakivo.com/blog/gfs-retention-policy-explained/