Ideally, the goal of backup is the ability to recover data from any point back in time. The straightforward way to do that is to keep periodical backups, usually daily. However, even with space-saving techniques like forever-incremental backups, synthetic backups, data compression, and deduplication, this approach requires unlimited storage capacities, and barely any company can afford this. That is why backup retention policy, or backup rotation scheme, exist.
What is GFS Backup Retention Policy?
GFS (Grandfather-Father-Son) استراتيجية الاحتفاظ بالنسخ الاحتياطية تسعى إلى هدفين: تقليل مساحة التخزين وتعظيم نقاط الاسترداد. ببساطة، مهمتنا هي الحصول على أكبر عدد من نقاط الاسترداد باستخدام أقل مساحة تخزين.
هناك بعض خطط دورة النسخ الاحتياطي بتعقيد وكفاءة مختلفين. أبسطها هو “أولاً داخل، أولاً خارجًا” (FIFO). إنه بسيط: عندما تنفد وسائط النسخ الاحتياطي من المساحة، يتم حذف أقدم نسخة احتياطية، ويتم كتابة نسخة جديدة مكانها. يكمن ميزة FIFO في بساطته، وأكبر عيب له هو حدوده المكانية، لذلك يمكنك مخزن محدد لعدد من النسخ الاحتياطية. وتعتمد هذه الفترة الزمنية المحددة على تكرار نسخ الاحتياطي لجهاز الكمبيوتر الظاهري وحجم مستودع النسخ الاحتياطي الخاص بك، ويمكنك تغطية فترة زمنية صغيرة نسبيًا بالنسخ الاحتياطية. ومع ذلك، تكون هذه الفترة الزمنية مغطاة بالكامل.
تحتاج جميع الشركات إلى تغطية احتياطية مماثلة؟ بالطبع، هناك بعض الشركات مثل المؤسسات المالية أو الحكومية حيث يمكن أن تكون فقدان البيانات حتى بسيطة مكلفة للغاية. لا أحد يرغب في أن تُبطل حسابه المصرفي أو الضمان الاجتماعي بسبب خلل معدات في مركز البيانات. لهذا السبب تنفق مثل هذه المؤسسات مبالغ كبيرة حقًا على التخزين الاحتياطي وأرشيف الشرائط وما إلى ذلك.
ومع ذلك، فإن معظم الشركات ليست حساسة للخسارة في البيانات بشكل متطرف، لذلك يمكنها تنفيذ نظام دورة احتياطية لا يتضمن تخزين نسخ احتياطية يومية طوال العام. تتيح هذه السياسة للاحتفاظ بالنسخ الاحتياطية إيجاد توازن صحي بين إمكانية استعادة البيانات والتكاليف المصروفة على البنية التحتية للنسخ الاحتياطي. أحد أشهر هذه السياسات هو نظام الدورة الجد-الأب-الابن (GFS).
كيف يعمل نظام النسخ الاحتياطي GFS؟
كما هو الحال في الأسرة البشرية، فإن الابن هو الأصغر، والأب هو الأكبر سنًا، والجد هو الأكبر سنًا. في عالم النسخ الاحتياطي، فإن الابن هو النسخة الأحدث من لحظة معينة، والجد هو الأبعد. عادةً، الابن هو النسخة اليومية، والأب هو الأسبوعية، والجد هو الشهرية. ومع ذلك، يمكنك إضافة المزيد من “الأقارب” بينهم، مثل النسخ الاحتياطية الساعية، والربعية، أو السنوية. على سبيل المثال، لدى نظام macOS من Apple أداة احتياطية مدمجة تسمى Time Machine تستخدم نظام الدورة الجد-الأب-الابن، حيث الابن هو النسخة النصفية للنظام الأساسي كل ساعة، والجد هو النسخة الشهرية.
النظام الكلاسيكي لـ GFS يعني النسخ الاحتياطي اليومي كـ ‘أبناء’، الأسبوعي كـ ‘آباء’، والشهري كـ ‘أجداد’. النسخة الاحتياطية الكاملة الأولية التي تم إنشاؤها يوم الاثنين تصبح الأولى ‘أب’. وتصبح النسخ الاحتياطية اليومية التدريجية التالية ‘أبناء’. تصبح آخر نسخة احتياطية في الأسبوع ‘آباء’ القادمة.
يتم تدوير “الأبناء” بناءً على نظام دورة الانتظار الأول من أول، حيث يتم استبدال أقدم “ابن” بالنسخة الاحتياطية التدريجية الجديدة، ويتكرر الدور. تصبح آخر نسخة احتياطية في الشهر “جد”. بعد ذلك، يبدأ ‘الآباء’ في التدوير وفقًا لنظام FIFO.
يمكنك رؤية النسخ الاحتياطية المتوفرة حتى نهاية يونيو في الشكل أدناه إذا بدأنا بعمل نسخ احتياطية لـ VM في أبريل: العناصر الزرقاء تمثل النسخ الاحتياطية المتاحة والرمادية تمثل تلك التي ليست متاحة.
واحدة من عيوب نظام GFS هي أن النسخ الاحتياطية القديمة تصبح أقل تفصيلاً. على سبيل المثال، إذا قمت بإنشاء ملف ما، على سبيل المثال، يوم الاثنين في الأسبوع الثاني من يونيو، ثم حذفته في اليوم التالي، فسيتم فقدانه بشكل لا رجعة فيه.
الاستنتاج
يمكنك، استنادًا إلى سياسة حماية البيانات لمؤسستك، إضافة نسخ احتياطية ساعية أو ربع سنوية أو سنوية إلى نظام دورة الانتظار لـ GFS. بتقنيات أخرى لتوفير المساحة مثل النسخ الاحتياطية التدريجية للأبد، والنسخ الاحتياطية الاصطناعية، وضغط وتكرار مستودع النسخ الاحتياطية، يوفر حماية بيانات معقولة دون الإنفاق بشكل كبير على بنية تخزين النسخ الاحتياطية.
Source:
https://www.nakivo.com/blog/gfs-retention-policy-explained/