自从有了云计算,人们就想着如何让数据中心和云计算更好地结合起来,于是“云数据中心”的概念出现,简单地说就是部署了云计算的数据中心。
但偏偏事与愿违,云计算和数据中心结合的例子并不多,更多的云数据中心只是将原来的数据中心换个名字,根本谈不上和云计算有什么关联。这也不能全怪云计算,怪只能怪数据中心底子太薄,根本满足不了云计算提出的种种要求,所以这几年云计算普遍难产,很少有落地生根发芽的,于是就有人想到了别的计算方法,以便能够满足更多不同类别的应用需求。当然任何一种技术都有其实现的局限性,孰好孰坏也只有靠实际应用的接受程度来决定。
在技术高度发达的今天,技术百花齐放,很难有一种技术可以解决现实中遇到的所有问题,只能是从某个角度来评判解决问题的可能性。那么对于数据中心,也不是只有云计算,还有雾计算、流计算,将来还可能有水计算、雨计算等等,数据中心结合这些新的技术才能发挥出更大的作用,下面就来说一说最近比较火热的几种计算技术,这些技术如果能够在数据中心里实施开来,必将开启数据中心的新篇章。
1、云计算
云计算大家都不陌生,虽然很多人并不真正知道云计算技术的含义,但是都在各种媒体、新闻中听到过。云是网络、互联网的一种比喻说法,云计算是基于互联网的相关服务的增加、使用和交付模式。云计算是一种按使用量付费的模式,按需进行分配。云计算是谷歌公司在2011年正式提出的,在此之前,其实谷歌就已经在2006年的搜索引擎大会上就提出过云计算的概念,当时还提到了云端计算的概念,经过了几年的探索期,直到2011年才让人们所熟知。云计算的特点就是技术网络来实现高速的计算,以往我们过分地强调单机的计算能力,不断地设计出高性能的计算机,以便可以计算得更快。
但是计算元器件是一点点地进步的,要大幅提升单机计算能力,就只能增加体积,所以出现了巨型计算机。但是不能一味地增加计算机的体积,而且过大的计算机也无法量产,只能用于特定的计算场合,比如超级数据中心,但是更多的数据中心却无法部署这些巨型机。为了解决这样的问题,互联网巨头公司谷歌想到了网络,可以利用网络将所有的计算机连接起来,然后通过软件去分配计算,让成千上万的计算机同时计算,并将计算结果结合到一起,得到最后的结果,这样的计算方法就是云计算。不难看出,云计算并不要求计算机性能多么好,只要数量够多,网络带宽够大就可以,这样就能得到超高速的计算能力,相当于用数千台计算机同时做同一件事,这样彻底将人们从追求巨型机设计中解脱出来,数据中心也不需要频繁地更换性能差的服务器和计算机,所以当云计算被推出来的时候,受到了技术人员的热捧。
2、流计算
和前两个相比,流计算知道的人比较少,这是蓝色巨人IBM提出的计算技术。IBM有一套完整的System S计算架构,通过流技术,可以对流形式的数据进行适时的分析。流形式的数据可源自结构化数据源或非结构化数据源,可能包含各种数字信号,针对流数据的实时分析允许组织实时响应市场警报或事件。
流计算可以通过过滤海量数据并识别丰富的高价值信息,从而支持更灵活且更敏捷的业务流程,实时关联和汇总支持数据中心更快地做出响应。流计算其实是一种针对特定数据的一种计算方法,其对针对特定的数据,而不关心计算的设备是聚集在一起的还是分离的,也不管计算设备性能如何,是一种非结构性数据的计算方法。
在传统的数据处理流程中,总是先收集数据,然后将数据放到数据库中,人们需要的时候通过数据库对做询问,得到答案。显然这些数据并不是实时的,再去查询的时候,得到的数据都是过期的,如果基于这样的数据进行分析,得到的结论很可能是错的。显然流计算可以很好地解决这方面的问题。不难发现,流计算与云计算、雾计算有着明显的区别,适用于特定数据处理场合,并不适用于所有的数据中心应用。
传统的计算机分析和数据整理方式,首先是收集数据,然后储存在数据库程序中并且在收到请求后搜索这些数据。这是一个高效的处理方式,但却是一个紧绷的结构,而且通常会造成时间的浪费。而在流运算当中,高级软件的运算法则在接收流数据时就开始对其进行分析。
以文本、语音和图像识别技术举例来说,流运算可以用于判定对于特定问题时,某些数据比其他数据具备更强的相关性。优先的数据会被程序进行专门处理,而这点对于复杂的、快速变化的问题格外有效,比如追踪流行病情况并且对其扩散做出预测之时;或者在电脑芯片车间从电子传感器收集数据并且快速找出生产出有瑕疵的产品。
流运算主要面向两种应用:对商业与科学计算当中的数据进行更快运算和分析的需求;对存在于Web网站、博客、电子邮件、视频、新闻、电话记录、传输数据、电子感应器之中的数字格式的信息洪流进行处理的需求。