<返回更多

跟踪服务器功耗的工具和技巧

2020-06-17    
加入收藏

每个组织对服务器的电源要求各不相同,但是监视峰值负载并跟踪服务器能耗以免发生业务中断仍然很重要。

服务器功耗是数据中心运营能耗的主要部分,必须进行监控和管理。服务器也是数据中心最大的能耗用户,但是实际的用电量取决于几个因素:服务器设计、核心处理器架构以及业务用例。

IT专家表示,服务器功率的测量和管理需要多种工具和方法的结合,而不能只看一个指标。

大数据分析之类的用例已极大地影响了传统服务器的定义,并且在过去五年中,机架单元的服务器功耗一直继续增加。

托管服务提供商Colovore公司首席技术官兼联合创始人Peter Harrison说:“通常情况下,一台传统45U机柜的峰值能耗为20~30kW。”

分析这些峰值能耗以防止潜在的运营问题至关重要。Harrison说,在机架服务器处理大量负载时,断路器可能会因突然出现的相位不平衡而跳闸。

与这些负荷有关的温度上升很容易在整个数据中心设施范围内持续增长。当组织运行大数据分析作业时,服务器风扇的排气温度可以达到122华氏度(50摄氏度)或更高。

他说:“考虑到消防和生命安全,机架中的所有IT设备都需要在这些条件下安全地运行,特别是配电系统。”

IT支持商HotHeadTech公司创始人Joseph Ferdinando表示,详细了解数据中心设施的基准功率要求和各种负载下的功率要求是明智的。

他说:“了解这些信息将告诉组织需要安装什么设备,以及在其数据中心需要配置多少个配电单元。这些信息还可以帮助IT团队规划未来的基础设施和长期目标。如果组织计划在未来12个月内进行扩展,则应考虑将功率需求基于预期的增长量,而不是当前的需求量。”

引入服务器功耗基准

对于具有测量服务器功耗丰富经验的管理员来说,一个容易跟踪的指标是空闲功率。

调研机构Gartner公司高级研究主管Tony Harvey说,“每个人对闲置功率都有自己的定义,只需要让系统稳定下来,这样就不会在后台加载任何负载,然后就可以对其进行测量,就会知道这个数字是多少。”

但是他指出,一旦管理员引入了主动测量和动态负载,跟踪服务器功耗就变得更加困难;每个组织在满载功率下的运营都是不同的。

Harvey说,服务器峰值功耗通常是通过最大化晶体管开关次数来定义和测量的。但是,哪种功率指标有用,取决于组织的要求和IT需求。

他表示,有用的功耗数据对于强调高性能计算并且具有大量浮点运算的组织而言是不同的,并且其功耗可能比同一核心处理器运行Oracle数据库还要大。

一种答案是采用现有标准,尤其是服务器效率评级工具(SERT)。该工具套件是通过美国能源之星计划与基准性能评估工具开发商Standard Performance Evaluation Corporation合作创建的,这个应用程序的名称为SERT Suite。

Harvey说:“这将产生一个可比的功率数值,以表明这台服务器比另一台服务器效率更高。”

Harvey表示,除了试图确定哪些服务器可能是高效运行,并进行相应的管理之外,组织可以减少电源转换的次数,从而降低成本和电源要求。

传统数据中心的电力供应通常来自电网的高压电源,首先需要将该电源转换为480伏的中压,然后降至220伏甚至110伏。在那里,交流电被转换成为直流电(通常为12伏),并且每次电源转换都有电力损耗。

使用基础设施管理工具绘制全景图

除了基准测试实现之外,还有来自大多数主要服务器供应商的电源管理工具。IDC公司研究总监Jennifer Cooke表示,大多数数据中心正在升级或已经配置到可以测量能耗的智能配电单元。

她表示,可以采用施耐德电气公司或Nlyte公司提供的数据中心基础设施管理(DCIM)来显示电力容量,数据中心运营商可以很好地了解其电力资源和消耗方式。另一方面,新的高性能计算工作负载现在需要更高的功率密度。

Cooke补充说:“许多服务器供应商都提供了功耗监控工具。这些工具可以与DCIM工具结合使用,以创建数据中心资源的数字孪生模型。数字孪生可以提供模拟业务和运营模型系统的显示方式。”

声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多资讯 >>>