灾难恢复中的风险影响评估:从何处开始

评估风险是在寻找减少风险并确保基础设施安全的方法中所需的第一步之一。创建有效的灾难恢复计划始于搜索基础设施要素的潜在威胁和漏洞,以及应对它们的方法。风险评估不是一次性的过程。您应定期更新风险评估政策,尤其是如果您运行的是一个不断变化的基础设施。我们的文章旨在解释灾难恢复规划中风险影响评估的重要性,并提供有关风险评估如何执行的基本信息。

风险影响评估:相关概念

评估风险是灾难恢复(DR)和业务连续性(BC)规划中的重要要素。虽然详细解释DR和BC需要两篇单独的博客文章,以下是这两种做法的简要概述:

  • 灾难恢复计划是一个文件,其中包含在发生事故时应采取的行动的明确定义算法。它的目的是简化从事故带来的负面影响中恢复。 DR计划中概述的指示旨在帮助公司维护或快速恢复关键业务,从而将停机时间降至最低。
  • 业务连续性计划是一组旨在防止潜在威胁并从公司面临的事件中恢复的行动。关键思想是确保公司的员工和资产受到保护,并且在发生灾难时能够恢复运营。BC计划比DR计划更广泛:它旨在确保业务在灾难发生后继续运营,而DR计划旨在快速减轻后者的负面影响。

在实施DR计划之前,会对您的业务可能存在的所有潜在漏洞和风险进行评估。一个好的做法是在进行业务影响分析(BIA)之后立即开始,这是DR策略的另一个重要组成部分,旨在确定如果您的任何业务功能或流程中断会导致的潜在后果。

灾难恢复风险评估是一个包含对组织运作潜在风险描述的文件。它涵盖了自然灾害和人为灾害,并估计了每种情景发生的概率。然后将估计结果乘以事故的后果。您得到的价值定义了您的组织对特定威胁的保护水平。该文件应该突出的一些基本主题如下:

  • 事件可能造成的潜在损害;
  • 减轻事件影响所需的时间和精力以及相关成本;
  • 减少灾难风险的预防措施;
  • 减少事件严重程度的指示。

风险评估是一个耗时的过程,需要技能和注意细节。在准备这份文件时,最好遵循指南,关注风险评估工具,并下载灾难恢复风险评估示例以获得更好的理解。

如何进行风险影响评估

通常,进行灾难恢复风险评估的过程涉及以下步骤。根据您的组织需求,您可以包括额外的步骤或跳过列出的一些步骤。

  1. 列出资产

确定对您的组织最有价值的资产是保护它们的第一步。资产是一个相当广泛的术语,可能包括服务器、网站和应用程序、客户数据库、数据库、纸质或电子文档等,甚至包括关键团队成员。

为了应对这一任务,考虑创建一个问卷。重要的是不仅从关键经理和部门负责人那里获得反馈,还要从公司所有员工那里获得反馈。这可以帮助您意识到可能被忽视的事项。开始记录每个部门内具体的风险和威胁。

  1. 识别风险

具体来说,您应该定义每个资产可能受到何种影响以及以何种方式受到影响。这包括软件、硬件、数据和员工。确保您正在遵循一种综合方法,尽可能涵盖各种形式和形状的灾难。这些包括:

  • 自然灾害。即使您的基础设施位于不太可能受到飓风或地震影响的地区,您也不能忽视火灾和水管破裂的可能性。在决定放置服务器的位置时,请考虑这一点。
  • 系统故障。故障的概率取决于您的计算机设备的质量以及您的维护工作。机器可能会突然关闭并停止功能,而没有任何警告或错误消息。此外,系统故障可能是由严重的软件问题引起的,例如糟糕的代码行。
  • 意外错误。培训您的员工,充足的休息时间,实施安全协议以及其他预防措施并不能完全消除人为错误的风险。您的一些员工可能会无意中删除重要文件,点击恶意软件链接,或者意外损坏设备。
  • 恶意活动。这一风险群体有各种形式,从传统的黑客攻击目标您的数据到内部威胁,如凭据滥用和故意修改或损坏数据。
  1. 找出漏洞

识别可利用于获取或损害公司资产的弱点非常重要。要执行未经授权的操作,攻击者需要一个可用于尝试利用系统弱点的攻击向量(即方法)。您IT基础设施中这些攻击向量的总和称为攻击面。关键思想是将攻击面减少到最低限度。

确保评估漏洞利用的可能性。这是确定安全漏洞优先级和分配资源消除它们的第一步。根据基于公共漏洞评分系统(CVSS)的统计数据,这是评估漏洞严重程度的行业标准,高严重性漏洞在大多数情况下都会被利用。然而,这并不是没有例外的规则。

  1. 评估潜在后果

进行风险影响分析,以确定如果任何资产受损,公司可能面临的财务损失。除了失去收入外,潜在的后果还可能包括数据丢失、由于停机而导致的IT环境损坏、声誉受损和法律问题。请注意,表面上的损失可能只是个开始。事故可能导致与公关和调查相关的隐藏成本,以及保险费上涨和法律费用。

  1. 优先处理风

为每对威胁和漏洞定义风险水平。根据漏洞利用的可能性和此事件可能带来的潜在后果的组合对其进行评估。尝试估计由于风险事件而可能导致公司损失多少收入。

优先级应该基于影响程度与事件发生可能性之间的相关性。如果事件可能导致严重的负面影响并且高度可能发生,那么该问题应该被赋予最高优先级。每种威胁应该被分配相应的值,从“非常高”(高风险可能性与重大经济损失的组合)到“非常低”(低可能性和微不足道的损害)。

  1. 记录结果

进行风险影响评估的最后一步是准备一份涵盖所有上述估计的报告或文件。以后,这份文件可以帮助您进行预算规划,资源分配,实施安全政策等工作。该文件应该描述每种威胁的脆弱性、潜在影响和发生可能性。为了更好地理解,下面是一个示例:

威胁 漏洞 资产 影响 可能性 风险 预防措施
服务器房间过热(系统故障)- 高 空调系统老化且维护不善 – 高 服务器 – 临界 服务、网站、应用等将不可用数小时 – 临界 服务器房间温度达到 40 摄氏度 – 高 每小时停机造成大量财务损失 – 高 购买新空调并确保更好的维护

刚开始时,您将更好地了解您的组织运营和流程,以及它们可以优化的方式。根据风险影响评估,制定一项规定公司每月、每季度或每年应采取的行动范围的政策。试图制定应对和减轻每种威胁的方式,并确定何时进行后续的风险评估。

提前做好准备

忽视准备全面的风险评估报告的重要性是最常见的灾难恢复风险之一。这份报告是减少事故发生可能性、减轻其负面影响并将停机时间降至最低的可靠助手。

作为一个例子,定期备份并将备份副本存储在离线位置是一个明智的做法,可以确保在各种情况下都能恢复数据,包括意外删除和服务器房间的完全破坏。此外,通过使用有效的副本,您可以通过几个点击从灾难中恢复。

NAKIVO备份与复制提供了各种工具和功能,帮助您备份和复制工作负载。以下是我们功能的简要概述:

数据备份

  • 备份虚拟、物理和云工作负载。
  • 从压缩和重复备份中立即恢复文件、文件夹和应用对象。您可以将数据恢复到源位置或自定义位置。此功能在局域网和广域网中均可使用,并恢复所有文件权限。
  • 发送备份的副本到离线位置,以确保它们不会因为意外删除、损坏、磁盘故障、网络攻击或其他不可预测的事件而丢失。

虚拟机复制

  • 创建VMware、Hyper-V和AWS EC2虚拟机的相同副本,也称为复制品。
  • 通过切换到虚拟机副本,几乎立即恢复您的业务关键操作。换句话说,您可以通过几个点击从软件或硬件故障中恢复受影响的虚拟机。
  • 执行从备份中进行复制以卸载生产环境并节省时间,这对于大型IT基础架构尤其重要。

为了确保最小的数据丢失和减少停机时间,提前做好准备。NAKIVO备份与复制以及适当的风险影响评估报告可以帮助您保护环境免受各种意外情况的影响。

Source:
https://www.nakivo.com/blog/risk-impact-assessment-in-disaster-recovery-where-to-start/