C114通信网  |  通信人家园

资讯
2018/10/17 14:29

阿里重构基础设施三大平台 提升数据中心运营效率

C114通信网  张海龙

C114讯 10月17日消息(张海龙)在昨日举行的2018开放数据中心峰会上,阿里巴巴研究员刘国华表示,智能化将给基础设施带来三大改变,数据驱动决策,全局优化,故障响应方式从被动转化为主动型服务。

刘国华认为,想要完成智能化建设最关键三步是,一,要把基础设施全面数字化,让所有东西都变成可衡量的体系;二,建设端到端全链条的自动化平台,保证决策规划和响应速度;三,建立TCO模型,实现良好的反馈机制,保证能不断优化模型。

为了实现智能化,阿里巴巴重新规划建设了基础设施领域的三大平台,即基础设施规划与交付平台,集群自动化运维平台,数据中心内部运营平台,并引入智能化方式,重新创造出新的业务形态。

其中,基础设施规划与交付平台主要负责从业务需求规划到基础设施规划,再到硬件研发、IDC建设、生产供应链以及OS交付,自动化交付平台等所有基础设施的规划、建设与交付。该平台主要针对交付效率,成本建设两方面优化。

为此,阿里巴巴基于机器学习方式,建立了业务规划驱动,通过这种方式,可以让业务具有更强的规划性在,平台可以快速把业务的规划转化成基础设施的规划,实现基础设施建设逐步基于业务的规划。通过这种方式,阿里巴巴规划效率提升近247%。同时,引入智能预测/预警系统,实时感知业务的任何变化,并且做出实时决策。

此外,阿里巴巴还为建设了供需模拟沙盘以及上架策略模拟,通过这种方式可以在线不断模拟以及优化阿里巴巴内部供应链的策略以及上架策略,实时反馈到在线系统,持续优化供应链的方式。目前其准确率达到每月85%左右。

集群自动化运维平台将解决服务器规模化后的运维效率问题及如何保证业务的稳定性。阿里巴巴构建了全自动化的运维方式,可以把所有物理机的运维跟上层运维相互解耦,实现无人化的运维。目前,阿里巴巴物理机已经100%运用全自动化运维方式。在智能化领域,阿里巴巴还为所有业务提供基于业务视角的数据决策支撑平台,把所有基础设施的成本、利用率融入到业务调度里,实现成本最优化。同时,针对每个业务不同类型的专业的优化,来提升整体业务的竞争力。此外,阿里巴巴还把集群运维的方式从原来被动响应式逐步转到主动服务式模式。

数据中心内部运营平台重点是提升内部运营效率以及实现能耗最优。目前为止,阿里巴巴通过数据中心内部运营平台把阿里巴巴每个人运维的服务器台数提升接近60%。

目前,阿里巴巴还正在建设全局能耗平台来做全局动态节能体系,并在每个领域做深度能耗优化,把能耗的数字化逐步跟上层业务结合起来,提升机柜利用率。截至目前,该平台最大可以提升接近20%的机柜密度,通过深度学习的方式PUE优化20%。未来数据中心的优化联动将实现全自动化,动态优化PUE。

给作者点赞
0 VS 0
写得不太好

版权说明:C114刊载的内容,凡注明来源为“C114通信网”或“C114原创”皆属C114版权所有,未经允许禁止转载、摘编,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。编译类文章仅出于传递更多信息之目的,不代表证实其描述或赞同其观点;翻译质量问题请指正

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141