数据中心温度过高,可能导致设备为保护硬件不受损而关闭,待系统温度恢复至正常值再重新启动。曾经有客户就有过这样的极端经历:数据中心有台IBM Power小型机隔三差五的在每天晚上12点到1点之间出现系统自动关机然后十几分钟再重新启动的故障。查询所有的日志发现,关机为硬件层的正常操作。可是该时间段内,并无人进出机房操作设备记录。经过几天的问题追踪,包括原厂的工程师现场排查,最后才发现问题的根源。
原来数据中心所在大厦每天晚上会停止中央空调的制冷供应来检修设备,而客户在晚上12点到1点之间恰恰设定为当天财务结算时间段,小型机会产生大量的计算操作,缺乏足够的制冷供应,导致小型机温度异常升高,于是设备自身保护机制启动了正常关机操作。
大家在经历上述类似经历之后,开始渐渐走入数据中心“越冷越好”的误区。然而,数据中心温度过低,容易导致能耗资源的巨大浪费。Intel有数据指出,全世界数据中心的温度,平均增加9度节省的能源量就相当于西班牙和南非等国家一个月的能源使用量。过去数据中心处于小规模状态下,能耗的运营成本占整体运营成本的小部分比例,因而多数客户会把更多的精力倾注在数据中心建设上而忽略能耗的运营成本。
经历了多年的数据中心建设的高潮期之后,数据中心规模持续发展,运营成本不断增加,能耗已然成为运营成本中的主要开支,能耗成本的比重甚至达到了数据中心运维总成本的60%-70%。无法忽视的巨额能耗成本,让大家也越来越关注如何通过节省能耗,来降低数据中心运营成本。
数据中心能耗成本中,除了IT设备计算能耗以外,制冷能耗占据了整体能耗成本中的1/4。降低制冷成本俨然成为降低能耗的主要手段之一。降低制冷成本最简单、也最为行之有效的方法就是提升数据中心的温度。
如何合理选择数据中心的最佳工作温度?
大家之所以走入“越冷越好”的误区,根本原因还是在于大家对于设备稳定运行温度的理解差异。在硬件技术飞速发展的今天,硬件设备可以支持的稳定运行温度相较原来已经有了很大提升,设备可以适应更加高温的环境,而大家对设备适应温度能力的理解还停留在过去,于是大家都会想当然的将温度尽可能地调低,来满足所有设备对于温度的需求。
虽然,在一些制冷系统比较先进的数据中心,已然可以通过区域进行局部调整,但是多数数据中心的温度调节,却还停留在按照整个数据中心进行调节阶段。由于温度的调节处于整区域,甚至整机房的调整粒度,经常会出现“管你冷不冷,反正我都给你制冷“的情况,大量的制冷能耗就在这样的情况下被浪费。
近年来,带外管理技术飞速发展,国内多数数据中心都开始进行带外网络的建设。通过带外网络连接设备的带外管理芯片,可以实时获取服务器设备的进风口、出风口温度。无需对设备进行任何改装,就能通过设备内部的传感器精准的获取设备的温度数据。
通过对每台设备的实时温度监测,可以将数据中心的温度调节下探到“设备级”,根据每台设备的温度规格,制定合理的温度阈值,实现一个“设备级“的数据中心热图。
通过“设备级”的温度调节机制,依赖带外管理技术监控每一台设备的温度情况,当出现异常高温的情况,结合空调群控技术、变风量地板技术进行更加智能的降温调控。
带外的温度监控技术,可以实现数据中心温度设置进入有据可依的阶段,出于对设备温度的精准掌控,可以让设备处于更高的合理温度范围,不必为了满足所有设备的最低温度需求,而让数据中心”越冷越好“。数据中心每合理的提高1℃的温度,散热成本就能降低4%。这将是未来数据中心能耗成本节省的一笔客观收益,也是未来智能数据中心的趋势。
原文:https://blog.51cto.com/14121283/2390773