原标题:怎样最小化云宕机事件的影响?

  9月15日技术沙龙

对您的云计算服务进行评估并编写SLA要比为简单连接服务(如虚拟专用网VPN)制定SLA要复杂得多。为了正确评估云计算SLA,应了解云计算体验的细节以及实际上是由谁来提供它们。寻找应用程序的工作流程,因为关键应用程序问题可以毁了一个很好的SLA。此外,要确定你有一个实际可行有效的验证和补救方法。

与东华软件、AWS、京东金融、饿了么四位大咖探讨精准运维!

图片 1

云计算并不是天生就是不可靠的,但是如同所有的IT形式一样,必须仔细挑选和管理云服务以实现特定的可靠性和可用性目标。这些步骤可以是合同形式的、是技术形式的或者甚至可能需要重新思考你的应用程序架构。如果没有经过慎重考虑,那么你从云计算中的收益可能要少于你的预期。

公共云计算服务在其范围内提供了令人难以置信的灵活性和效率,但是其广度范围取决于服务成本、可用性以及性能。这提供了评估云计算SLA中常见错误和最佳实践的信息。其涵盖内容包括响应时间SLA、从网络供应商和云计算供应商处获得保证,混合云计算SLA问题等等。

遵循应用程序的工作流程

SLA降低了使用云厂商数据中心而产生的风险

云计算服务买家对于云计算SLA的最关键错误是忘记所有应用程序都是真正的工作流程。一个通过网络连接从用户发向应用程序的请求通常是由多个组件组成的。然后,该请求会导致产生流向其他组件的工作——在云计算内的或者返回数据中心的——以及对位于云计算内外数据库的多次访问。最终,通过网络向用户返回响应结果。

免受云宕机事件影响的第一步就是要评估云厂商数据中心的可靠性。大部分的云厂商都拥有着很少数量的数据中心,通常情况下只有一个,而这些数据中心易于产生与企业相同类型的故障。最广为人知的云计算故障往往是那些整个云计算数据中心发生故障的事件,通常都是由于自然灾害而发生的故障。为了在有可能发生的故障中保护好你自己,你必须要求特定的数据中心配置信息或从你的供应商那里获得可用性保证。

如果SLA只关注于这一过程中的某一点(例如与公共云计算托管相关的一部分),那么SLA是没有用的。如果这一工作流程的任意部分中断,那么应用程序就会发生故障。如果这一流程中的任何部分发生性能问题,那么应用程序的使用体验质量就会受到影响。当其他环节只是得到笼统的保证时,那么只是针对云计算内性能或可用性的严格要求是没有任何好处的。

对于服务器、存储设备和网络的可用性,最好的策略是在谈判时就确定SLA,以便于指定可用性保证和发生故障时恢复服务的时间。用户应当了解在云计算数据中心所在的区域是否会经常发生诸如飓风或暴风雪这样的灾害性天气,这一点是非常重要。同时,还应确定数据中心是否配有备用电源,是否配有一个能够接替正常工作的备用数据中心。

让所有参与者都确保SLA

备份数据中心必须位于不同于主数据中心的另一区域,所以它就不会受到相同问题的影响,同时它还必须拥有足够的容量以处理云应用的故障转移。由于很少有供应商能够为主数据中心的100%故障转移提供足够的备份数据中心容量,所以SLA将说明如何管理故障转移。

评估云计算SLA的另一个问题是无法让所有相关参与者都确保SLA。云计算工作流程通常涉及三方——企业本地自有网络的员工、让员工访问云计算的网络供应商以及云计算供应商。具体可能还涉及企业的数据中心(网络与托管)和提供“云计算至数据中心”连接的另一家网络供应商。供应商通常不会撰写或接受用于处理他们所不涉及工作流程环节的SLA。你需要让他们同意成为他们为此收取一定费用的“主要承包商”或者为所涉及的每一方得到或编写一份SLA。

在这种情况下,为优先级支付费用可能是必要的。如果你的云服务包括了地理多样性以支持分布式的用户群体,那么你自己的各种设施就可以为云厂商故障提供某些保护措施;仔细检查你的合同以确保有足够的容量来处理额外的负载。

通常SLA中的最大问题是网络连接问题,因为在大多数情况下,除了在云计算本身内部的情况外,云计算供应商是不会提供网络服务。如果你希望严格的SLA,那么你将需要为网络服务编制一份SLA。所以,你应当首先确认你的云计算供应商是否会提供一个VPN或者他们是否能够与你所使用VPN服务的供应商进行协作。在很多情况下,你仍然需要使用互联网来实现用户的连接性,但是VPN将为你提供一个你希望获得保证的坚实网络边界。

相关文章