【干货】企业如何制定正确的灾难恢复流程
随着越来越多的企业受到网络犯罪的威胁,灾难恢复 (DR) 在过去几年中对业务优先级的重要性日益增加。
但是,IT 灾难不仅限于网络攻击,硬件故障、人为错误、停电以及飓风或地震等自然灾害也有可能破坏企业的业务流程,并将有价值的数据置于风险之中。
这凸显了企业需要采取措施确保最小化停机时间的重要性,不过好在很多企业正在为此做出积极的响应。根据 Spiceworks 公司最近的一项研究,95% 的组织都制定了灾难恢复计划,其中 90% 的计划包括灾难恢复 (DR) 计划中的数据完整性和备份。
其他领域包括维护网络和互联网连接 (62%),电源 / 电力连续性(57%) 和本地服务器 / 应用程序正常运行时间(57%)。但是只有 28% 的企业表示,在其灾难恢复计划中包含云计算或托管服务,考虑到现在有大量的企业依赖基于云计算的平台,这一点令人惊讶。
这表明,灾难恢复并没有一个万能的解决方法,企业需要投资满足其独特需求,并确保选择最适合其特定需求的灾难恢复解决方案。
寻找合适的人选
企业需要回答的第一个问题是“灾难恢复解决方案如何适合现有的基础设施?”。一般来说,大多数探索和采用灾难恢复解决方案的企业属于三个部门之一:拥有物理数据中心,并希望其灾难恢复服务基于数据中心基础设施的组织; 拥有物理数据中心,但希望其灾难恢复解决方案基于云平台中的组织; 以及希望其数据中心基础设施和灾难恢复解决方案都是基于云计算的组织。
对于将数据存储在物理数据中心,并希望灾难恢复位于数据中心基础设施上的组织来说,它们通常需要单独的副本环境,以便能够提供全部或部分客户的服务。这可能是一种成本高昂的方法,因为企业必须考虑与维护设施、支付电力和购买额外硬件相关的成本。
而拥有物理数据中心但希望其灾难恢复解决方案位于云平台中的组织,以及希望其数据中心基础架构和灾难恢复解决方案基于云计算的组织,都依赖云计算提供商的数据中心作为恢复站点。
虽然每种方法各有利弊,但基于云计算的系统被证明是最具成本效益和最有效的方法,可以最大限度地减少灾难事件的影响。但是如前所述,最有效的灾难恢复计划是满足业务特定需求的计划。
可以理解,在这三种环境中实施灾难恢复所需的流程和解决方案 (内部部署、混合部署或云计算) 各不相同。企业可以根据需求制定计划,同时考虑到需要保护的不同基础设施的性质以及停机对业务的影响。
那么,在制定灾难恢复计划时,企业需要记住什么? 将如何选择确保正确的解决方案?
规划灾难恢复
对于任何灾难恢复策略,第一步是将业务应用程序与服务级别目标相匹配,其中有两个特定的衡量参数:恢复点目标 (RPO) 和恢复时间目标(RTO)。
恢复点目标 (RPO) 表示发生灾难时业务流程的数据丢失容限 (即数据丢失量超出业务需求可接受的数量),而恢复时间目标(RTO) 表示在中断后恢复业务服务所需的时间。不同的应用程序将根据其重要性和业务类型而有不同的要求。例如,eBay 公司或亚马逊公司等主要在线零售商将要求其核心电子商务系统具有较低的恢复点目标 (RPO) 和恢复时间目标(RTO),而规模较小的企业中的一些应用程序能够在 24 小时内脱机。
通过映射其环境并分析特定应用程序的风险和要求,企业可以确定最有效地满足恢复点目标 (RPO) 和恢复时间目标 (RTO) 参数的灾难恢复解决方案。他们可能会意识到,内部部署方法最符合其未来目标,或者将所有内容移至云端是满足客户需求的最佳方式。
企业可能还必须考虑内部可用的技术技能水平。 虽然这对于拥有大型 IT 团队的大规模组织来说并不是什么问题,但是那些根本无法获得所需技能的小规模组织来说,可能不得不选择托管的基于云计算的灾难恢复服务。
最后,重要的是要记住,不同的需求需要不同的方法实施正确的灾难恢复解决方案满足特定需求,因此企业必须分析其基础设施类型,并将这些需求考虑在内。
在这个持续可用性预期的时代,很多企业根本无法承受停机的损失,当然必须投资于防止灾难发生的解决方案,但当这些解决方案无法阻止灾难发生时,企业必须准备好立即做出反应,否则将会面临客户投诉的风险。