微软利用无线感应器追踪数据中心的温度 极大节省了电能
微软全球全球基础服务部门(负责监管微软在线服务平台)现采用一套无线感应器网络来提高公司数据中心的可视性,减少因过于冷却大型 IT 设备机房所浪费的电能。这套系统微软研发部门开发,于 2006 年首次测试,现已应用于微软全球各地的数据中心。
这个项目被称为 Data Center Genome (DC Genome),起始于 2006 年微软在一个数据中心测试一些感应器。至今,公司已逐渐安装了 700 多个个感应器,追踪全球数据中心里单个支架和搁架的温度,从而使微软可以实时获取每个服务器支架的温度或湿度信息。
微软研究中心网络嵌入式计算机小组的主要负责人 Feng Zhao 在与微软数据中心服务总经理 Michael Manos 的一次会谈后,便开始着手开发这套系统。微软数据中心服务属于微软全球基础服务,负责设计、建造和管理公司的许多数据中心。当时,微软业务发展非常迅速,全球越来越多用户都使用公司的网络服务如 Hotmail 和 IM。为此,微软不得不在全球建立必要基础设施,如服务器数据中心,支持不断增加的用户流量。这不仅需要上千的服务器,还需要足够的电能来保证机房以保持适当温度。
“问题是,这么多的服务器,我们怎样才能知道每台服务器的情况” Zhao 称。通常,工作人员很难判断空调系统是否正常运行,具体服务器是否超过安全温度限制等。绝大多数的数据中心都很大 - 每个机房的平均面积约为 470,000 平方英尺- 存放多个服务器支架。每个数据中心的空调系统都必须确保机房内任何一个服务器支架的温度不会超过特定值。一个数据中心的消耗的每百万瓦特电能中和 0.5-1 每百万瓦是被用于维持机房的温度。因为无法清楚机房内任一点的温度,绝大多数的机房只能最大化地使用空调。
网络嵌入式计算机小组的任务是研究先进的感应器技术和计算机节能技术;到 2006 年,这个小组已经开发出无线感应器。“我们研究感应器技术有相当长一段时间,我认为数据中心是一个理想应用场所” 他称,认为这项技术可以帮助数据中心减少电能消耗。“采用感应器追踪温度,从环境和商务的角度来看都是可行” 他称。
在接下来几年时间内,这个团队在微软多个数据中心小规模地测试无线感应器。最终在西雅图几个数据中心全面采用这套系统。
系统由小型、电池供电的设备 Genomote 组成。Genomote 有两种类型,子 Genomote 和母 Genomote - 两者集成共同组建无线感应器节点,将数据导入后端系统,这样微软就可以实时监测数据中心,并定位热点。
母 Genomote(左)和子 Genomote(右)
“如果温度超过了一定的界限,服务器会运行不稳定,从而影响微软的网络服务” Zhao 称。
子 Genomotes 包含感应器,每 30 秒测量一次温度和湿度,接着通过电缆连接将数据上传到母 Genomote。母 Genomotes 的功能类似于特定类型的 RFID 标签,以符合 IEEE 802.15.4 标准的 2.4 GHz 信号进行通讯,形成一个网状网络,将信息从一个母 Genomote传到另一个上,直至到达一个基站,基站含一个与后端系统以太网相连的接收器。如果一个基站出现了问题,系统指示数据传输继续进行,直到达正常工作的基站。
Zhao 的团队在每个服务器架的前面或背面安装一个母 Genomote 及几个子 Genomote。“一个典型的配置包括 3 个子感应器节点” 他称:“分别位于支架的顶部,中部和底部,并与主节点相连”。微软拒绝透露目前有多少个数据中心采用这套系统。
利用微软研发中心开发的软件系统,这些数据可以显示在地图上。地图显示数据中心的布局,实时高亮度地显示热区。软件还可以存储这些数据,用于事件分析,评估特定时间段内数据中心的情况。
当机房任何地方的温度超过了安全线时,系统会及时通知微软。微软利用这些数据来评估整个中心的情况,调整温度或风扇的速度。温度过高的服务器会被关掉或将数据转入另一台服务器上。
“举个例子,我们曾经在一个数据中心安装这套系统,这个数据中心的房间通常包括冷热通道。在冷通道,空调系统的冷空气经过服务器前端。热通道是服务器产生的热废气输送回 AC 系统进行冷却。采用感应器后,微软发现热废气渗漏到冷通道,影响服务器的冷却能力” Mano 称。为此,工作人员在支架下装金属片来防止热气渗漏。
目前,这套系统已安装在微软的多个数据中心,Manos 称,他可以办公室查看全球服务器的情况,还可以储存服务器温度的历史数据。当某个支架上热模式发生显著的变化,公司可以及时了解到。举个例子,一天内网民过多使用 IM 或其它服务会导致一些服务器温度的升高,现在,微软通过调整服务器工作量,在特定时间内激活或关掉一些服务器,有效地解决了这个问题。“这让我们明白服务器的容量和功能,帮助我们优化数据中心” 他称。
微软现在和 AC system 测试感应器集成,使微软可以基于感应器的测量自动升高和降低温度。