作者 | CDA数据分析师

1、前言

大数据革命引发了数据中心的爆炸式增长,这些中心正在以越来越高的速率消耗能源。本文回顾了两种提高数据中心效率的标准方法,并认为第三种方法-机器学习-是最佳解决方案。

天网,VIKI和HAL 9000就是一些具有机器学习功能的AI的例子。创建它们的目的是解决对人类而言过于复杂的问题,并通过神经网络对其进行控制,以提高效率,安全性和成功率。当然,电影需要对立面,因此这些AI奇迹给了不利的黑暗面——但是这种复杂的机器学习是真实的并且已经成功实现。

自2000年代以来,数据中心已经激增。一个大型电子商务服务数据中心仅用几个19英寸机架来部署所需的服务器,存储器,以及网络设备。如今,超大型数据中心成千上万的硬件设备部署在数千个机架上。它们源自本地办公室的小型服务器,现已发展成为超大型设施,以维护我们的物联网和所有相关数据。美国人使用的数据,流程,连接性和存储量需要大量电力,这意味着数据中心是主要的能源消耗者。占全国年用电量2%的行业和政府专家正致力于提高效率,因为预计数据中心的需求将会增加。

目前,解决此问题的方案主要有两个方面:

  • 他们必须使旧的数据中心尽可能高效
  • 他们必须建立更高效,更大的数据中心

但是,它并没有确定解决此困难的解决方案。而真正的解决方案在于实现机器学习系统。通过它们的过程,可以减少数据中心的能耗,并使其效率比以前更高。如今,部署依赖于机器学习的工具的数据中心运营商正在从效率和可靠性方面获得最初的收益,但他们才刚刚开始摸索机器学习将对数据中心管理产生的全部影响。

机器学习是人工智能的子集,有望优化未来数据中心运营的各个方面,包括计划和设计,管理IT工作负载,确保正常运行时间以及控制成本。IDC预测,到2022年,由于具有嵌入式AI功能,数据中心中50%的IT资产将能够自主运行。

2、数据中心能耗

容纳大量服务器场的大型,不起眼的容纳器慢慢地在美国兴起。这是全球性现象,因为数据和信息都以数字方式存储,因此需要空间。由于节省了大量资金,我们对人类的模式和趋势有了更复杂的了解。不幸的是,将数据存储在服务器中并不像一个库。他们需要恒定的功率来产生热量,并且热量需要被冷却,从而消耗更多的能量。

2014年,仅美国数据中心就使用了约700亿度电,从这个角度来看,1 kWh将使智能手机充电一年。需要能源以保持数据中心24/7全天候运行,使用大量的冷却系统进行冷却以及在紧急情况下维持冗余电源。也就是说每年维护在大约七十亿美元,能源成本影响着每一个人。消费者,数据库提供者和环境都感受到了如此大量能源消耗的后果,但我们的利用率没有丝毫放缓的迹象。因此,利用和能源效率是适应的主要目标。

图1:数据中心的用电量(十亿千瓦时/年)

美国至少有300万个数据中心,足以容纳该国每100个人中的一个。数据中心的增长非常复杂,大多数服务器和相关设备都是在2000年至2010年期间购买的。但是,随着服务器空间使用效率的提高和对大型数据中心的依赖性增加,统计数据表明存储量将适应而不是增加。

3、能源效率,更好的建筑计划和机器学习

有些人可能认为办公服务器比新的超大规模数据中心更有效率。或在破土动工并不必要地淘汰它们之前,应使用较旧的就地数据中心。这些想法有逻辑上的支持,独立服务器由其所有者处理,并且回收而不是更换,但是它们实际上并不起作用。现场服务器需要数据中心做的所有事情,因此公司在自己的服务器场上花费更多的钱,而不是使用远程中心所需的确切空间。而且,较旧的数据中心在构建时就没有考虑能源效率,因此,即使是看似新的数据中心也可能已过时。

图2:数据中心总用电量(十亿千瓦时/年)

美国能源部鼓励大规模实施能源效率。他们的“更好的建筑”计划邀请企业和数据中心减少能耗或使用可再生能源。诸如Google之类的大型科技公司率先采用了这种方式,通过机器学习系统来减少其数据中心的能耗。

4、DeepMind –面向数据中心和未来的机器学习

机器学习是AI的过程,能够从场景中学习并做出反应,而不是通过编程的选项做出响应。机器学习系统会获得历史数据,参数(目标),并通过模仿我们自己大脑功能的神经网络进行操作。它们非常适合数据中心,这些数据中心对于以前的系统和专业人员来说已经变得复杂起来,无法有效地进行管理。数据中心每天都会发生近十亿次事件,只有通过直观的系统才能处理这些事件,以实现最大的可操作性。例如:

  • 设备-设备/人员-人员的交互对于每个中心和日常事件都是唯一的
  • 传统的系统和人员无法迅速适应导致重大能量损失的内部/外部微小环境变化

Google通过输入DeepMind系统,希望将其能降低和保持40%的能源效率,这是一个通用系统,他们希望广泛发布以减少能源使用。Google数据中心团队针对某些操作场景对DeepMind进行了培训,创建了自适应参数,输入了历史数据(例如温度和泵速),并将目标定位为未来的电源使用效率(PUE)。PUE实际上是建筑能耗与IT能耗之比;用于衡量能源效率。

当部署在Google的数据中心时,它可以通过分析难以理解的数据集并建议采取的措施来成功地减少能耗。这听起来与最初提到的AI所承担的任务相差不远。幸运的是,科幻小说与科学之间有清晰的界线。诸如DeepMind之类的系统是一项优势,能够以人类无法掌握的规模降低能耗。随着时间的流逝,更多的系统将实施机器学习,以便它们可以最大限度地提高可操作性,从而为人们节省金钱,更重要的是,为环境节省了资金。

Uptime Institute研究副总裁Rhonda Ascierto说:“这是数据中心管理的未来,但我们仍处于早期阶段。”IDC Cloud to Edge数据中心趋势服务研究总监Jennifer Cooke表示,随着越来越多的公司采用包含云,托管设施和内部数据中心的混合环境,并且将越来越多地包括边缘站点,创建更智能的数据中心变得越来越重要。

5、机器学习在数据中心的应用

何为机器学习?简单来说,机器学习是从例子和经验(即数据集)学习而不是依赖于硬编码和预定义规则的算法。换句话说,不是开发者告诉程序如何区分苹果和橙子,算法被数据“训练”并且自己学习如何区分苹果和橙子。以下是当今数据中心管理中机器学习的五个最大用例:

5.1 效率分析

Ascierto说,当今的组织正在使用机器学习来提高能源效率,主要是通过监视温度和调整冷却系统来实现的。

例如,谷歌在今年早些时候曾发布,它正在使用AI通过分析21个变量来自动管理和优化其数据中心的冷却,例如外部气温,数据中心的功率负载以及后方的气压。发出热气的服务器。该公司表示,Google的机器学习算法可实时自动连续不断地调整冷却装置的设置,从而使冷却每年的能源使用量减少30%。

此外,它可以就设计或配置数据中心的最有效方法(包括IT设备或工作负载的最佳物理位置)提出建议。

5.2 能力计划

机器学习可以帮助IT组织预测需求,因此它们不会耗尽电力,冷却,IT资源和空间。例如,如果一家公司正在整合数据中心并将应用程序和数据迁移到中央数据中心,则算法可以帮助其确定此举如何影响该设施的容量,Ascierto说。

DCIM软件供应商Nlyte Software的首席战略官Enzo Greco说,容量规划是组织建立新数据中心的一项重要服务,该公司最近推出了数据中心管理即服(DMaaS)产品,并与IBM Watson合作对其进行了集成。将机器学习功能纳入其产品。

“您需要使数据中心尽可能准确。您需要多少台服务器?您需要多少冷却?您只需要与服务器数量一样多的散热。”他说。“此外,您需要多少电量?这取决于散热和服务器容量。”

5.3 风险分析

在所有用例中,使用机器学习进行风险分析是最关键的,因为它可以识别异常并帮助防止停机。“机器可以检测出异常,否则将无法发现,” Ascierto说。

例如,施耐德电气的DMaaS可以分析来自关键数据中心设备(例如电源管理和冷却系统)的性能数据,并预测何时可能出现故障。施耐德电气数据中心解决方案架构师副总裁Joe Reele说,当算法检测到异常现象时,系统会警告客户,以便他们能够在设备出现故障之前进行故障排除。

5.4 客户流失分析

将来,Ascierto看到托管服务提供商使用机器学习来更好地了解他们的客户并预测他们的行为-从购买或添加新服务到续订合同甚至支付账单的可能性。她说,这是客户关系管理的扩展,可以包括通过聊天框自动进行客户互动。

Maya HTT已经分析了客户情绪。Duquette说,它目前没有数据中心客户使用它,但是通过自然语言处理,该公司的软件可以分析电子邮件并记录支持电话以预测未来的客户行为。

5.5 预算影响分析与建模

Ascierto说,这将数据中心的运营和性能数据与财务数据(甚至包括适用税项在内)混合在一起,以了解购买和维护IT设备的成本。她说:“它模拟了一件设备的总拥有成本和整个生命周期,例如一种冷却系统与另一种冷却系统相比。”

例如,Salesforce在2016年收购了一家名为Coolan的初创公司,该公司使用机器学习来分析IT设备的总体拥有成本,直至单个服务器组件。问题是越来越多的公司将使用机器学习进行预算影响分析的时间。一些私人公司可能会自己做,但是这很复杂,因为它要求以计算机模型可以提取的格式容易获得财务数据。

出于安全原因,DMaaS客户不太可能希望与第三方共享其财务数据。她说:“对于DMaaS服务,在早期,让客户共享他们的财务数据是一个比较棘手的提议。”

这个领域还不成熟,但发展速度很快。人工智能系统正式交付使用还将需要一定的时间,就像数据中心招募的新的工作人员一样,不过类似的机器学习工具终将可以真正的帮助您运营数据中心。

机器学习如何推动数据中心发展?相关推荐

  1. 推动数据中心绿色转型(经济透视)

    近年来,随着物联网.云计算.5G的快速发展,全球范围内掀起数据中心建设热潮.美国市场研究机构"协同研究集团"最新数据显示,截至2020年上半年,全球超大规模数据中心达541个,比5 ...

  2. 《浙江省推动数据中心能效提升行动方案(2021-2025年)》出炉

    近日,省发展改革委.省经信厅.省市场监管局.省大数据局.省能源局.省通信管理局联合印发了<浙江省推动数据中心能效提升行动方案(2021-2025年)>. 明确3大发展原则 ❖统筹协调,均衡 ...

  3. 【节能、绿色、高效】数据中心发展正迈入“高算力”时代

    蒸汽时代,社会发展靠的是"铁路网":电气时代,发展动力靠"电网":而数字经济时代,这个世界将要依赖"算力网". 随着数字经济成为当前全球主要 ...

  4. 广东省新型数据中心发展白皮书

    1.白皮书梳理了在广东省数字经济高速发展的背景下,数据中心产业发展现状,总结产业发展经验与成果,为广东省新型数据中心发展提供参考. 2.根据白皮书统计,2021年广东省数据中心市场规模达到164.1亿 ...

  5. ChatGPT人工智能热潮之下,NCSI功能OCP网卡助力数据中心发展

    继美国OpenAI发布ChatGPT后,百度召开"文心一言"发布会,引发了新一轮人工智能热潮.此次狂潮的兴起,进一步拉动算力需求的高增长,推动数据中心朝着高技术.高算力.高能效.高 ...

  6. 模块化,数据中心发展的必然趋势

    罗森伯格亚太电子有限公司陈凤霞 一.前言 自IT解决方案供应商SUN推出全球第一个移动式.虚拟化的数据中心Black Box起,这种将网络机架.空调.配电柜.消防.安防.监控,甚至UPS.发电机等数据 ...

  7. 【观察】华为:持续创新,场景聚焦,推动数据中心实现可持续发展

    毫无疑问,在数字经济时代,数据被纳入"新型生产要素",而数据中心作为承载数据价值的关键,不仅是国民经济发展的重要基础设施,更成为了科技创新和技术应用的实体.也正因此,过去十几年数据 ...

  8. IDC干货:5个维度!全面综合分析我国城市数据中心发展情况

    众所周知,数据中心是承载数据的基础物理单元,是算力基础设施的重要组成部分,是促进5G.人工智能.云计算等新一代数字技术发展的数据中枢和算力载体,现已逐渐成为各行业数字化转型的重要支撑,对于数字经济增长 ...

  9. 数据中心发展现状与趋势

    更多专业文档请访问 www.itilzj.com 1.2.1 数据中心发展历程 从业务功能上划分,在数据中心基础设施的基础上,结合不同的应用需求,具有数据处理.灾难备份.网络服务.开发测试.用户支持等 ...

最新文章

  1. 系统聚类(hierarchical clustering analysis)
  2. 千山独行-一个人的创业路(连载五)
  3. War-Driving(战争驾驶***)
  4. java 方法保存变量_java – 在初始化对象或将其保存为变量并调用该方法时,调用方法的速度更快...
  5. 中科院遥感与数字地球研究所博士后招聘
  6. 微课|中学生可以这样学Python(例8.25):二分法查找
  7. 将Linux代码移植到Windows的简单方法
  8. NSUserDefaults 的用法
  9. 使用UML工具分析类图与类的关系-bouml(java和C++)
  10. 3701汉化包 axure r9_Axure RP 9.0.0.3701 for Mac 中文共享版 – 知名的产品原型设计软件...
  11. 国产操作系统之深度deepin安装
  12. 再说setlocale——关于区域名称
  13. 数据结构-银行业务模拟系统
  14. SaaS行业验尸报告:他们死于资本狂欢前夜
  15. iOS TextField收取键盘的方法
  16. 电脑装windows和安卓双系统引导_Remix mini安卓电脑,玩的不只是Windows那张皮
  17. GCN学习:用PyG实现自定义layers的GCN网络及训练(五)
  18. js中的escape方法有什么用?
  19. Hadoop安装及部署
  20. WMS发展历史与趋势

热门文章

  1. 第06章 空间钢架结构(简支梁),(四点吊装)的深入分析及拓展
  2. win7 rdp协议访问linux虚拟机,使用Windows远程桌面(mstsc)通过RDP协议访问Ubuntu/Debian服务器...
  3. 超经典!国际著名计算机教育推动者发表计算机原理文档,面面俱到
  4. 高敏感的医疗设备在道路运输过程中冲击和振动干扰的质量监测
  5. 新建一个日期对象,格式为年月日
  6. 为什么MyISAM会比Innodb的查询速度快。
  7. python图片读取优化_Python下图片的高斯模糊化的优化
  8. python关联规则挖掘_python数据挖掘 pycaret.arules 关联规则学习
  9. 即时通讯服务 发送图片 语音,视频 实现方式。
  10. 提供曲库、评分、修音功能的 K 歌 SDK-iOS 版本