什么是云计算的高可用性?阿里云云计算高可用性介绍
发布时间:2017-06-08 15:29
云计算环境中,由IaaS以及PaaS这两个层次内部所实现的高可用性能力,对于上层服务来说是极有用的特征。尤其是在大规模的云计算环境中,成千上万的节点所必然产生的失效状态是云计算管理系统锁必须解决的问题。尽管云计算环境底层的高可用不见得能够解决上层服务的高可用问题,但是研究并增强底层的高可用性无疑是一个很有价值并且具有挑战性的工作。
关于高可用的定义
维基百科的定义:Highavailabilityisa systemdesignapproachand associated service implementation that ensures a prearrangedlevel of operational performance will be met during a contractualmeasurement period.
百度百科的定义:高可用性”(HighAvailability)通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性
关于计算机系统的高可用性实现方式,百度百科给了3种,分别是(1)主从方式 (非对称方式)(2)双机双工方式(互备互援)(3)集群工作方式(多服务器互备方式)。
在云计算环境中,高可用的实现方式显然以第二种和第三种为最好,在保证高可用的同时,利用多机分担负载,也具有高的扩展性(Scalability)。通常来说,云计算的计算资源和存储资源是以集群形式实现的,特别强调可扩展性,因此,理论上说,第三种是最优选择。当然,在工程上,有一个开销与收益的权衡。例如Hadoop0.19版本的设计中只有一个NameNode,一旦Name Node挂掉,整个Hadoop集群都会失效。后来有某个组织提供了NameNode的双机双工解决方案这就解决了Name Node的失效问题。如果引入集群方式解决NameNode的问题,方案想必会更加复杂。
云计算环境大致应该包含两类不同功能的系统:1. 为用户提供计算、存储、传输等服务的系统;2.管理前述系统的系统。这两类系统的设计初衷不同,导致其所采取的高可用方案不同。
对于前者,为用户提供服务的系统,本身是分布式的,节点失效作为常态之一,在系统设计之初就被考虑进去的。此外,用户可以在应用层面,另行考虑高可用性,也使得这个层面的问题有多种方法得到解决。
对于后者,管理云服务系统的系统,需要集中数据、集中处理的功能特征很多,难于利用集群的方式实现,在高可用性和可扩展性两个方面都面临着较大的问题。在这个领域中,可能需要解决的问题包括:
大量集中数据的存取及SQL检索所需的分布式数据库;
大量节点间通信过程所需的分布式名字服务;
分布式的消息总线
此外,SLA驱动的云计算服务框架,也涉及高可用性方面的工作,从管理云服务的系统,一直到为用户提供服务的计算节点、存储节点。
相较于普通的IDC机房以及服务器厂商,阿里云会使用更严格的IDC标准、服务器准入标准以及运维标准,以保证云计算整个基础框架的高可用性、数据的可靠性以及云服务器的高可用性。
阿里云云计算的高可用性
在此基础之上,阿里云所提供的每个地域都存在多可用区。当您需要更高的可用性时,可以利用阿里云的多可用区搭建自己的主备服务或者双活服务。对于面向金融领域的两地三中心的解决方案,您也可以通过多地域和多可用区搭建出更高的可用性服务。其中包括容灾、备份等服务,阿里云都有非常成熟的解决方案。
在阿里云的整个框架下,这些服务可以非常平滑地进行切换,相关的信息可以在阿里云行业解决方案中找到。无论是两地三中心,还是电子商务以及视频服务等,都可以在阿里云找到对应的行业解决方案。
此外,阿里云为您提供了如下三项支持:
提升可用性的产品和服务,包括云服务器、负载均衡、多备份数据库服务以及数据迁移服务DTS等。
行业合作伙伴以及生态合作伙伴,帮助您完成更高、更稳定的架构,并且保证服务的永续性。
多种多样的的培训服务,让您从业务端到底层的基础服务端,在整条链路上实现高可用。