A disruption or a disaster can happen when you least expect it. In fact, 80% of data center managers have experienced an outage in the past three years. Whether it is a cyber attack, ransomware infection, human error or natural disaster, lengthy downtime can have a detrimental impact on your organization’s operations.
擁有強大的業務持續性計劃(BCP)作為風險管理策略的一部分,使您能夠在發生中斷時保持或迅速恢復關鍵功能。BCP還保護公司的基礎設施,並作為您可以遵循以正確應對事件的大綱。
本文列出了業務持續性計劃檢查表的基本要素。繼續閱讀,以發現您應該採取的成功恢復業務運營並減少影響的最佳行動方案。
為什麼您需要業務持續性計劃
A business continuity plan (BCP) determines how an organization can continue delivering products and services during unplanned disruptions. The BCP is a detailed strategy that helps mitigate the impact of a disaster on day-to-day activities while keeping the production environment going.
A comprehensive BCP should tackle all potential threats that could endanger your employees, resources and operations, whether it is a power outage, a malware infection or a natural disaster. This is particularly important since all these events can cause downtime, which, in turn, results in financial loss, reputational damage or permanent closure.
業務持續性計劃的主要目的是確保應急準備,使您的應對團隊能夠在擾亂情況發生前、期間和之後有條不紊地完成必要的步驟。沒有這份檢查表的公司可能會在維持正常業務流程方面遇到困難,並冒著永久丟失數據、系統或客戶的風險。
7步業務持續性計劃
這份7步檢查表幫助您制定一個優先事項的一般框架,您可以在此基礎上建立一份根據您的組織量身定制的業務持續性計劃。您可以包括在危機期間維持業務運作所需的所有程序。請記住,根據不同的因素,如企業規模、行業和威脅類型,各公司的具體細節會有所不同。
標準業務持續性計劃通常包括以下步驟:
讓我們仔細研究每個步驟,以了解為什麼它們是任何BCP檢查表的重要元素。
1. 創建災害應變團隊
制定業務持續性計劃的第一步是組建負責在緊急情況下保持公司運作的團隊。 BCP團隊應包括來自參與日常運營的每個部門的成員,並且應該有一位經理被指定為主導業務持續性規劃工作的負責人。
在確定關鍵BCP人員時,您需要創建一個詳盡的災害列表,該列表對您組織構成最大威脅,以便您招募到合適的人才。 不同類型的緊急情況,如IT系統故障,停電或設施損壞,都需要具有特定知識和專業技能的工作人員來妥善且迅速地處理。
建立一個表格來記錄應急響應小組成員的相關信息,這樣你可以在必要時輕鬆與他們聯繫。你的表格可以包括姓名、職位、應急響應小組角色和聯繫信息。請記住,你應該為每個小組角色至少指定一個替代人選。這樣可以避免在主要代表未能履行職責時出現瓶頸。
識別必要的業務服務
業務持續性計劃的主要目的之一是幫助你識別對組織運作至關重要的流程、設備和資源。這些是你應該圍繞BCP構建的重要基礎設施功能和服務。
這些關鍵服務和基礎設施元素很可能包括:
- 電力系統和發電機
- 電信設備-廣域網、局域網、電話、計算機
- IT系統和服務器
- 建築基礎設施和設施
- 專業設備或業務關鍵供應品
在發生中斷情況時,盡快恢復這些元素至關重要,以恢復你的業務運作並保護你的資產。
進行風險評估和業務影響分析
識別關鍵業務服務後,您應進行風險影響評估,以發現與關鍵系統、活動和資源相關的弱點。風險評估評估每個威脅的概率,並反映災害發生的可能性。
通常與風險評估一起進行的業務影響分析(BIA)使您能夠評估對您的業務運營的影響的關鍵性和嚴重性。 BIA 的主要目標是分析風險實現時您將負擔的財務和運營成本。它幫助您確定重要流程和依賴的容忍水平,例如客戶和合作夥伴,如果關鍵業務功能受損,中斷或完全停止。
這是一個簡化的表格,您可以將其用作起草您自己分析的模板:
業務流程 | 影響類別 | 嚴重性 | 最大可容忍停機時間(MTD) | 估計成本 | 依賴關係 |
請注意,擁有多個站點的組織必須對每個位置進行單獨的風險評估和業務影響分析(BIA)。如果這些站點地理上相距遙遠,那麼面臨的挑戰和風險可能不同。健全的業務持續性計劃還應考慮不同位置之間的關係和依賴。
4. 制定恢復計劃
災害復原和商務持續性 緊密相連,尤其是災害復原(DR)計劃是商務持續性計劃的必要部分。如需更詳細的災害復原範本,請下載我們免費的白皮書 災害復原手冊和範本。
DR 計劃概述您需要執行的技術步驟,以及恢復您的核心服務所需的時間。請記住,復原計劃不僅限於數據,還應包括機器、工作負載和流程。
您的復原計劃可能將採用以下策略(但不限於此):
- 替代業務程序——例如,直到系統恢復運行為止的機械化或自動化流程的手動工作around
- A secondary or alternate site to resume business operations
- 網絡和伺服器層級故障轉移
- 僅供備用的臨時數據恢復
- “熱備用”或待命資源,可以立即服務時主要元件發生故障
下方視頻將解釋如何使用 NAkIVO Backup & Replication 執行完整的災害復原。
5. 設定恢復目標並指定 DR 站點
恢復時間目標或 RTO 確定業務可以合理容忍多少 IT 系統停機時間,而在流程或服務恢復之前。恢復點目標或 RPO 定義業務可以容忍多少數據丟失。RTO 和 RPO 都是任何業務持續性計劃中重要的指標。
為網絡/數據故障轉移指定一個災難恢復(DR)站點至關重要,因為它在您的主要生產站點離線時提供了一個即時替代品。此外,它幫助您確保達到恢復目標。位於不同地理位置的 DR 設施作為您的資源(如虛擬機器(VM))的“溫暖備用”副本。在導致生產網絡停擺的全站故障事件中,流量可以轉移到 DR 位置。這些“溫暖備用” VM 實質上變成了生產工作負載,有效地恢復了業務運營,確保業務持續性。
您可以使用先進的第三方數據保護解決方案將生產 VM 複製到離岸 DR 位置,並將複製間隔設置為與您的 RPO 對齊。複製的 VM 是原始機器的精確副本,可以在實施災難恢復計劃時用於自動故障轉移過程。
6. 確保所有業務關鍵工作負載都受到保護
災害的影響可以通過妥善保護業務關鍵數據來顯著減輕。按照3-2-1規則使您的備份具有彈性:在至少兩種不同類型的存儲媒體上進行至少3次備份,並且至少有1份備份存儲在離線位置。
按照3-2-1備份方法論執行業務數據備份,以實現可能的最短RPO和RTO。這也可以確保影響您生產網絡的同一災難也不會影響您的備份數據。
7.測試並更新您的業務持續性計劃
一旦您的業務持續性計劃完成,就需要進行嚴格的測試。最好的方法是通過培訓您的員工來確保他們充分了解自己的角色和責任。如果不進行定期培訓和演練,則無法保證應急準備。更重要的是,通過進行全面模擬,您可以識別並修復計劃中的弱點。
確保您執行所有程序以模擬實際災難情景的流程。此類測試最好每季度進行一次,因為關鍵團隊成員仍然熟悉該流程。此外,基礎設施、環境、協議、工作負載和/或勞動力的變化可能會導致計劃中的複雜性。這些潛在問題通常僅在完全運行時才會發現。
模擬應該由一位獨立觀察者觀察,他可以記錄所有的漏洞。每次完整運行後應進行簡報,然後您可以起草一份報告,記錄所注意到的弱點和建議的更新。報告以及更新後的業務連續性計劃應與所有團隊成員分享。
業務連續性計劃檢查表
這是一份簡化的BCP檢查表,允許您遵循必要的階段以確保應急準備。
建立災害應對團隊
- 指定BCP高級經理
- 建立業務連續性委員會
- 選擇應對團隊成員
- 定義角色和責任
- 為每個團隊成員選擇次級代表
- 建立所有成員之間的清晰溝通
確定必要的業務服務
- 映射所有電力系統
- 識別電信設備
- 識別IT系統和服務器
- 識別設施和專業設備
- 確定服務之間的相互依存關係
- 檢查緊急服務
進行風險評估和業務影響分析
- 識別威脅和漏洞
- 建立風險容忍度
- 確定關鍵業務流程
- 計算每項服務的最大可容忍停機時間
- 分析財務、法律、監管和客戶影響
- 識別關鍵業務功能之間的相互依存
制定恢復計劃
- 建立業務連續性計劃 (COOP)
- 為自動化流程起草手動解決方案
- 準備現場級別的網絡和伺服器故障轉移
- 測試臨時備份的關鍵數據
- 確保待命資源可用
設定恢復目標並指定災難恢復 (DR) 站點
- 指定次要站點以恢復業務運作
- 設定恢復點目標 (RPO)
- 設定恢復時間目標 (RTO)
- 管理災難恢復流程
保護業務關鍵數據
- 為業務關鍵數據執行備份
- 在現場和離岸儲存設備上存儲數據
- 存儲空氣隔離備份
- 為特定備份啟用不可變性
測試並更新您的業務連續性計劃
- 進行年度、半年度、季度測試
- 每年進行完整的BCP模擬
- 建立審核流程
- 識別漏洞並更新計劃
- 培訓您的員工
結論
A business continuity plan checklist is essential to ensure that services can carry on smoothly while you recover the impacted workloads following a disruptive event. Organizations that fail to create a BCP risk suffering from major downtime and data loss which can cause irreparable financial and reputational damage.
這個檢查清單提供了一個有效的業務持續性計劃框架,可以幫助您應對最壞的情況。請記住,沒有像NAKIVO Backup & Replication這樣的先進數據保護解決方案,BCP是不完整的。NAKIVO解決方案包括您執行備份和恢復流程、自動化DR工作流程以及進行非中斷DR測試所需的所有工具,以確保滿足您的恢復目標。
Source:
https://www.nakivo.com/blog/business-continuity-plan-checklist/