作者:阿里集团 阿里云智能事业群 云原生应用平台
来源:华章科技
云原生(Cloud Native)的概念,最早是由Pivotal于2015年提出的,但是即使到了2019年上半年,国内对其的关注依然相对有限。直到2019年9月,“云原生”才突然一跃成为行业最热门的词汇。
不过,时至今日,业界对于云原生的定义并没有完全统一,在云原生不断演进的过程中,衍生出了包括Pivotal、CNCF(Cloud Native Computing Foundation,云原生计算基金会)、十二因子应用等多个版本的定义。
同时,还有不少人将云原生与容器或基于Kube.NETes的微服务混为一谈。还有云原生技术、云原生产品、云原生架构、云原生理念等看起来意思相近的词汇。那么云原生到底是什么?云原生会对我们的应用开发产生什么样的影响呢?
云原生可分解为“云”(Cloud)和“原生”(Native)两个词。这里还隐藏了一个词——“计算”(Computing),因为云原生本质上是一种与云计算(Cloud Computing)相同的计算方式,因此通常我们在说云原生的时候,实际上是暗指云原生计算(Cloud Native Computing)。
基于这样的背景,下面我们将进一步探讨云原生的概念及其影响。
既然说到了云原生(计算),那么哪些计算方式不是云原生(计算)呢?要回答这个问题,同时辨析云原生的概念,我们需要先回顾云计算的发展历史,以及与之密切相关的分布式计算的复杂性问题。
云计算的概念最先由戴尔公司于1996年提出。2006年,亚马逊公司率先推出了弹性计算云(Elastic Compute Cloud,EC2)服务,随后越来越多的企业开始逐步接受云计算这一概念,并将应用逐步迁移到云端,享受这一新型计算方式带来的技术红利。
2009年,阿里巴巴率先开始研制具有完全自主知识产权的云产品——飞天操作系统,由此揭开了中国云计算的序幕。
纵观软件架构的演化历史可以发现,任何新的底层软硬件技术出现后,上层应用软件都需要很长一段时间才能够真正“认识”到新的软硬件给上层应用软件带来的价值,并开发新的软件架构,以便充分利用新软硬件的能力。
最典型的例子就是x86 CPU和服务器在面世二十多年后,以CORBA、EJB、RPC、瘦客户端等为主的多层架构才逐步成为应用开发的主流架构。
类似的还有容器技术,它最早是由FreeBSD于2000年在Jails中提出的,但真正得到大规模应用是在2013年Docker兴起之后,而应用层的代表则是几年之后基于容器的微服务架构。
对于云计算这一新基础设施来说,也是如此。在2015年之前,对于大多数应用来说,云端只是一个用于计算的场所,开发人员所要做的就是将原来在私有数据中心或IDC中的应用,迁移到云端。在迁移的过程中,应用无须重新编写,只需要重新部署,因为云平台提供的计算、存储、网络等,完全兼容应用迁移之前的计算环境。
迁移之后,应用的整体成本(Total Cost of Ownership,TCO)因为采用了“按量付费”的模式而大幅下降,同时,企业的IT支出从CapEx (Capital Expenditure,资本性支出)模式转变为OpEx(Operating Expense,管理支出)模式,整个IT支出变得更可控。
如果对迁移过程进行技术分析,就会发现大部分应用使用的技术或者产品都在进行“一对一”的替换,只有极少量应用会基于OSS(对象存储服务)、MaxCompute(大数据计算服务)等云服务进行部分重构。
OSS能够帮助解决分布式状态的存储问题,而MaxCompute能够解决数据仓库的快速搭建和成本问题。但由于没有或者只进行了少量重构,因此应用的技术栈本身几乎没有发生变化,也就是说,软件的架构没有发生变化,只是软件运行的平台和运维的技术体系发生了变化,即只有平台层面的变化。
而软件在分布式场景下需要解决的问题,包括稳定性、组件或服务之间的数据同步、整体的高可用或容灾、CI/CD过程的自动化、资源利用率不高、端到端链路跟踪等,仍然需要应用自行解决。这些问题并不会因为应用迁移到了云平台就从根本上得到了解决。
当然,各云平台为了帮助应用解决上述分布式复杂性问题,不断推出各类云服务,但是由于应用架构本身并没有发生变化,因此这些云服务并不能帮助应用解决整体问题,只能从局部提升应用的效率。
面对大量的业务需求和场景迭代,很多云平台都提供非常专业的垂直领域服务,这些服务比企业基于开源自行搭建的系统具备更高的SLA(Service Level Agreement,服务等级协议)。
比如,在数据持久性方面,亚马逊AWS的数据持久性可以达到99.9…%(11个9),阿里云OSS的数据持久性甚至达到了99.9…%(12个9);在跨可用区的高可用方面,阿里云RocketMQ的高可用达到了99.95%,即使整个机房不可用也能继续对外提供消息服务。
可见,应用迁移到云上并不代表从此以后就高枕无忧了,如果应用本身没有基于“新”的云服务进行重构,而是继续采用“老”的架构,那么即使业务运行没有问题,应用也不能充分利用“新”的云运行环境的能力。
因为这些架构是为了“老”的分布式运行环境而设计的,不是“云原生的”,所以需要对这些架构以及围绕这些架构建立的技术栈、工具链、交付体系进行升级,依托于云技术栈将其重新部署、部分重构甚至全部重写,才能将应用变成“云原生的”,从而保证能够充分利用云计算的能力。
为了让应用能够更好地使用云的PaaS平台能力开发SaaS(Software as a Service,软件即服务),Heroku于2011年提出了十二因子应用的概念。十二因子应用适用于任何编程语言,通常被认为是最早的云原生应用的技术特征,详情请参考:
http://12factor.net/zh_cn/
之后,Pivotal于2015年明确地提出了云原生的概念,指出云原生是一种可以充分利用云计算优势构建和运行应用的方式。
在经过CNCF的修改后,最新版云原生的定义为:
云原生技术有利于各组织在公有云、私有云和混合云等新型动态环境中构建和运行可弹性扩展的应用。云原生的代表技术包括容器、服务网格、微服务、不可变基础设施和声明式API。这些技术能够构建容错性好、易于管理和便于观察的松耦合系统。结合可靠的自动化手段,云原生技术使工程师能够轻松地对系统做出频繁和可预测的重大变更。
上面三个主流的定义,分别从顶层架构原则、计算模型和代表技术的角度,对云原生进行了描述。这些定义的共同点是它们都将云原生看作一种新的计算方式,让应用能够充分使用云的计算优势。
进一步分析这些定义所体现出的技术观点,我们可以达成这样一个共识:只有结合云原生所提供的云服务,改造应用的架构,才能够更好地使用云原生技术,更好地构建弹性、稳定、松耦合的分布式应用,并解决分布式复杂性问题。
此外,对架构的改造还意味着相关的开发模式、交付方式、运维方式等都要随之改变,比如,采用微服务架构重写应用,用声明式API和自动化工具升级运维方式,等等。简单来说,云原生使得整个软件的生产流水线都发生了巨大的变化,而具体的变化程度又取决于企业对云原生的使用情况。
实际上,云原生的范围还不止于此。要正确实施云原生这一新计算模式,还需要企业的IT决策者、架构师、开发人员与运维人员正确理解和应用云原生的理念,利用合适的云原生技术及产品。有太多的反例可以证明,仅靠单边的技术升级是很难让云原生升级产生价值的。
云原生相关概念之间的关系如图1-1所示。
▲图1-1 云原生相关概念之间的关系
在图1-1中,现代化应用在不少场合与云原生应用的概念是等同的,因为它们的很多特征都是相似的,比如,都采用了容器技术打包和交付,都具备很强的弹性能力等。这两个概念的细微差别在于:现代化应用可以与云相关,也可以与云不相关;而云原生应用通常都与云相关。
所以云原生(或者说云原生计算)应当包括云原生技术、云原生产品、云原生架构以及构建现代化应用的开发理念,如DevOps,具体说明如下。
如今,云计算已经成为企业数字化转型的新的基础设施,同时也是国家“新基建”的核心环节,是物联网和人工智能的赋能平台。从市场发展趋势看,云计算将是未来IT的主流。
根据Gartner的数据,未来云计算市场规模仍将保持20%以上的增长速度,到2025年,预计将有80%(2020年仅为10%)的企业会关掉自己的传统数据中心,转向云平台。
2019年,我国云市场总规模达到了1334亿元,同比增长38%,其中,公有云市场规模达到689亿元,私有云市场规模达到645亿元。在2020年年初,我国各行业对远程办公、远程教育等的需求持续增长,预计到2022年,我国云市场总规模将突破3000亿元。
此外,根据工业和信息化部提出的企业上云工作目标,2020年云计算将在各个行业广泛普及,全国上云企业将新增100万家。
从技术发展趋势看,更多企业将会广泛应用云原生技术。在国家政策和企业需求的双重驱动下,更多企业会选择上云,中国云计算的强势增长是必然趋势,这也注定了更多企业将会关注、应用、采纳能够充分利用云计算能力的云原生技术和产品。
据Gartner预测,到2023年,全球70%的企业都将在生产中运行三个或更多的容器化应用。
据中国信息通信研究院(简称信通院)统计,2019年43.9%的被访企业表示已使用容器技术部署业务应用,另外计划使用容器技术部署业务应用的企业占比为40.8%;28.9%的企业已使用微服务架构进行应用系统的开发,还有46.8%的企业计划使用微服务架构。
从软件开发角度看,云原生技术为企业带来了更快进行业务创新的价值。越来越多的企业逐渐意识到了云服务的专业性和高SLA,这些企业在数字化转型的过程中将IaaS和PaaS的通用技术复杂性委托给了云平台,从而能够更好地专注于自身业务逻辑的创新。
利用云原生技术重塑企业的软件生产流水线,可以加大业务组件的复用程度,将软件交付周期从周、天降低到小时甚至分钟级别,从而提升业务的市场嗅觉灵敏度,增强市场反应能力。
从应用技术栈角度看,越来越多的企业发现传统的应用已经无法满足数字化业务的需要,所以会对应用进行彻底升级,会更多地采用云原生技术和云原生架构作为构建现代化应用的核心框架,从而帮助企业打造具备弹性、韧性、可观测性、API驱动、多语言支持、高度自动化、可持续交付等特性的现代化应用软件。
从云原生的定位可以看到,云原生包含大量新的PaaS层技术和新的开发理念,是释放云计算价值的最短路径,也推动着云计算的再升级。
整个云原生技术栈都是基于开源、开放的技术标准。CNCF也在致力于云原生技术的标准化,为云原生技术和产品的用户提供使用云服务的标准界面,同时避免了厂商锁定。
进一步看基于云原生技术和云原生架构重构或重写的应用,比如,基于服务网格或无服务器技术(Serverless)的应用,它们天然具备水平扩展的能力,可随时应对互联网时代高速增长的业务规模,同时还内置了高可用能力,所以应用无须关注分布式环境下的高可用方案。
所以,云原生不仅是对使用云的应用架构的再升级,也是对云平台的技术和云服务的再升级。从构建现代化应用的角度,我们可以发现,云原生对应用的重构体现在应用开发的整个生命周期中。
关于作者:阿里云智能 基础产品事业部 云原生应用平台:致力于为企业打造数字创新的最短路径。历经15年的探索,阿里云是国内最早实践云原生的云服务商,拥有最丰富的云原生产品家族和Z全面的开源贡献,打造云原生裸金属服务器、云原生数据库、数据仓库、数据湖、容器、微服务、DevOps、Serverless等超过100款创新产品;构建完整的云原生技术与服务生态,覆盖新零售、政务、医疗、交通、教育等各个领域,推动企业快速实现数字化创新与业务增长。