C114通信网  |  通信人家园

技术
2019/6/26 16:34

重点业务感知监测分析机器人在网优智能化中的应用研究

邮电设计技术  

摘要

广西联通基于前期积累的网络优化经验,积极探索机器学习、软件编排等技术,开发了“重点业务感知监测分析机器人”,从数据自动获取与数据处理、感知问题预测、智能定界分析、报告智能撰写输出、邮件推送这五大过程来智能洞察并优化重点业务感知,其应用效果显著,实现了网络优化从传统的“人工分析”到“智能分析”模式的变革,为未来的网优智能化进行积极探索。

关键词

智能网优、机器人、指标预测、告警邮件推送


引言

当前移动互联网数据业务流量呈现爆炸式增长态势,各类业务层出不穷,业务感知性能以成为运营商网络优化的重中之重,传统网络优化工作模式在优化的实时性、准确性、效率、成本等方面的弊端进一步凸显,为了对业务感知性能 “提前或第一时间发现问题,精准快速智能分析定界并解决问题”这一目的,广西联通基于前期积累的网络优化经验,开发了“重点业务感知监测分析机器人”,实现了网络优化从传统的“人工分析”到“智能分析”模式变革,为未来的网优智能化进行积极探索。

传统网络优化面临的挑战与思维转型

当前网络结构复杂、业务多样化、影响网络质量因素多,感知问题分析定位效率低、准确性差等问题日益凸显,而传统的网络优化以人工为主,无法适应日益复杂的网优工作需求,因此需要加快优化工作转型。本次广西联通结合现有的重点业务感知分析优化的工作场景,基于机器学习、软件编排、互联网等技术,充分挖掘丰富的网络数据资源,并设计与开发出“重点业务感知监测分析机器人”来智能洞察优化重点业务感知,为未来的网优智能化转型积累优化经验。

图1: AI+移动网络运维网优发展趋势

重点业务感知监测分析机器人实现流程与技术原理

重点业务感知监测分析机器人的设计与实现,主要基于机器学习从历史数据中学习和建模,以洞察出影响业务感知的规律特征,并通过软件设计编排等实现自动化、智能化的“机器工作”来代替“人工工作”,以提升工作效率和准确性。

2.1基于机器学习的重点业务感知监测分析机器人的流程框架设计

结合广西联通上网业务人数、流量、业务请求次数等情况,最终选择以微信、腾讯视频、淘宝、王者荣耀、高德地图等6类15种重点业务进行监测分析,如表1所示。

表1:重点业务监测指标

重点业务感知监测分析机器人主要基于R语言软件与数据库进行数据交互和逻辑运算,实现对业务的KQI实时监控和提前预测,并快速对监控到的告警问题智能分析定界和自动输出报告,并下发告警邮件推送通知。本次以微信业务为例进行说明。其框架如图2所示。

图2:重点业务感知监测分析机器人的流程框架设计图

(1)数据库连接及数据源验证

数据源主要来自S1-U信令数据,包含了URI、RTT、IP_LEN等业务特征、业务感知有关的字段。通过搭建R语言与数据库的数据交互环境,并结合历史数据源对当前入库的数据源质量进行监控验证,减少因数据源异常影响系统整体的准确性。基于模型算法得出历史同时段的数据量波动规律,对比当天各接口数据量差异性,若超过设定的阈值则判断该时段数据源出现异常则自动触发“数据源异常”的告警邮件推送通知。

(2)指标配置及实时监控

在数据源无异常的前提下,通过R语言的逻辑算法对关键指标进行配置和实时监控。指标的配置即把关键指标统计逻辑转换成R语言能识别并统计的机器语言;实时监控即利用R语言设置的逻辑算法对每个关键指标持续统计和监控,及时发现指标告警信息,并把该时段的指标写入本地历史指标变化表中。

(3)指标跟踪及指标预测

该模块主要针对本时段的指标设置告警规则,基于时间序列模型对未来一个时段的指标变化趋势进行预测。告警规则的设置主要是将本时段统计到的指标设置不同的阈值并对应不同的告警级别,达到告警条件则利用R语言发送内容为“本时段告警+未来时段变化趋势”的邮件。而当告警级别高时则自动跳转到智能分析定界和自动生成报告模块,并发送“本时段告警+未来时段变化趋势+自动定界报告”的告警邮件。

(4)智能分析定界及生成报告

若指标的告警级别高,则进入智能多维分析定界并生成报告的模块。本模块主要是基于R语言中能自动化生成报告的Rmarkdown脚本实现。原理是利用R语言与数据库交互的数据,针对告警指标在多维度建立各自的逻辑算法聚类分析,最终定界出指标告警的原因并自动生成Rmarkdown报告。

(5)告警及报告邮件推送

借助R语言的mailR包相关函数,把“数据源是否异常”、“指标预测趋势”、“指标告警及级别”、自动化定界报告等的信息以邮件的形式自动化发送给相关人员。

2.2基于时间序列的业务性能预测模型选择

时间序列预测是一种基于历史数据的延伸预测,也称历史引伸预测法,通过编制连续的时间序列并分析其反映出来的发展过程、周期和趋势,进行类推或延伸,借以预测下一段时间可能达到的水平。结合历史数据与工作经验发现业务流量和性能指标均会随时间变化的连续变量,并且呈现规律性的周期变化,符合时间序列算法的应用场景。因此本次主要采用“时间序列预测的指数平滑法”进行建模研究与应用。

(1)指数平滑法原理与应用

指数平滑法即根据历史资料的上期实际数和预测值,用指数加权的办法进行预测。优点是只要有上期实际数和上期预测值,就可计算下期的预测值。其中三次指数平滑法适用于有趋势和季节性的序列,故本次使用此算法,以微信业务上行RRT时延指标(TCP三步握手的第一步上行连接服务器时延)为例进行建模。

指数平滑法分为预测方程和三个平滑方程,一个是水平,一个是趋势,一个是季节性成分,采用平滑参数α,和γ,用m代表季节性周期:

其中,确定了季节性指标的估计源于最后一个季节的样本。(u代表不超过u的最大整数)。水平方程指出了季节调整量(yt-st-m)和非季节性预测(lt-1+bt-1)之间的加权平均。趋势方程与Holt的线性方程一致。季节性方程表明了当前的季节性指标(yt-lt-1-bt-1)和上一周期的季节性指标的加权平均。即所有先前的预测值都对当前预测值产生了影响。(lt-1+bt-1

(2)建模与效果检验过程

第一步对原始历史数据进行建立时间序列并对数化,其目的为了消除数据源的异方差,减少数据的波动对预测效果的影响。

第二步对数化后的时间序列进行应用HoltWinters算法(R语言包)进行预测建模。本次建模预测的alpha为0.60,即表明近期的观测值的影响权重比较大,大多数预测值与真实值相差不大,具有比较高的可信度。

第三步对未来值进行预测及效果检验,首先预测未来N小时的上行RTT时延;其次对预测效果进行检验,检验延迟1-20阶中的预测误差是否非零自相关,相关图呈现样本内预测误差在滞后9阶时超过置信边界略明显,其他基本在置信空间以内;再次继续采用Ljung-Box检验得出p =0.004919,意味着置信度只有99.51%这样的值不足以拒绝“预测误差在1-20阶是非零自相关,则可接受预测误差在1-20阶是非零自相关的,如图3所示(蓝色为预测部分)。因此按照以上基于HoltWinters算法的时间序列预测模型,可以有效的预测微信业务性能变化趋势。其中本次建模训练出来上行RTT动态阈值在50ms以下视为正常波动。

图3:未来值的预测及效果检验

2.3业务感知问题智能分析与自动化输出报告流程技术原理

广西联通基于前期积累的网络优化经验,在智能定界及自动化输出报告中应用了一套针对业务感知的自动化报告逻辑定界方法。

2.3.1业务感知五维分析定界法

在实时监控重点业务性能时,若某时段发生高告警级别(一级)时,将跳转至“五维分析定界”模块。主要思路为:(1)对单业务多天的性能进行时间维度分析,得出恶化时间和恶化程度;(2)在业务维度排查该时段是否多重点业务恶化,若仅单业务恶化告警,初步归类为“云(SP)”原因,并对该告警业务筛选恶化的IP;(3)若出现多个重点业务同时恶化,则通过设备维度排查SGW/PGW核心网问题,集中则初步归类为“管原因”;(4)排除非核心网因素后,则进入对地市区域维度排查,若地市集中,则初步归类为“区域原因”,输出该地市恶化eNodeB列表;(5)最终基于用户维度统计该时段影响用户的占比,若影响用户占比<5%,则最终均定界为“端原因”。即基于业务感知五维分析定界法,通过端,管,云角度智能定界出造成业务感知恶化的原因。业务感知五维分析定界法主要流程如图4所示。

图4:业务感知五维分析定界流程图

2.3.2基于Rmarkdown的自动化报告输出

自动化报告输出主要是利用R语言的RMarkdown包对数据库的数据进行查询,针对告警指标在多维度建立各自的逻辑算法聚类分析,最终定界出指标告警的原因并自动生成报告。其中RMarkdown包可将R计算(代码块)与普通文本相结合,用简单灵活的方式来完成文档的标记并转换成PDF、word、html等格式文档输出,起到快速生成数据分析报告和减少重复性数据分析报告撰写工作的作用。Markdown在RStudio的编程界面如图5所示。

图5:MarkdownRStudio的编程界面图

2.4实时告警邮件推送

告警邮件推送技术主要是基于R语言的mailR包实现对邮件标题、正文以及添加附件等内容进行设置,并发送给指定的收件人邮箱列表。将该模块代码嵌入至机器监控系统时,即可实现自动“监控-告警-通知”的发现问题及时通知功能,实现程序如图6所示。

图6:R语言发送邮件代码示例图

应用效果案例

基于机器学习的重点业务监控及预测分析系统,广西联通在5月28日的实时监控业务感知发现:微信业务当天12时上行RTT平均时延457.59ms;且基于时间序列模型预测当天13时将会继续恶化,预测值为483.23ms,如图7所示。

图7:重点业务上行RTT时延跟踪与预测

系统自动触发“重点业务(微信)出现上行RTT时延一级告警”,进入到智能化分析定界模块并自动生成报告,并于2018-05-28 13:07:37将邮件推送给相关人员。其重点业务感知智能分析报告如图8所示。

图8:重点业务感知分析报告智能化输出呈现方式

结合业务感知五维分析定界法得知:1)近三天的波动系数较小,未出现明显波动,该业务在5月28日12时开始恶化;2)未发现同时段其他重点业务出现明显时延高情况;3)微信业务请求次数TOP50涉及的IP中,IP为58.144.137.(11-20)的时延均大于600ms以上;4)该时段使用恶化重点业务时延大于安全阈值(80ms)用户数占比为64.56%;综上所分析定界为云问题。

结合实际人工拨测和信令问题分析,主要感知问题为用户感知微信业务中的朋友圈图片打不开或出现白屏现象,如图9所示。

图9:微信朋友圈图片白屏图

广西联通与腾讯团队迅速成立联合工作组,开展微信业务感知优化提升工作。在提供分析数据并联合微信团队优化服务器响应机制后,上行RTT时延从原来的457ms下降至36ms,微信朋友圈白屏现象恢复正常,有效的提升了微信业务用户的上网感知。本次通过基于人工智能的重点业务预测分析及邮件推送的应用,第一时间发现业务感知的问题并智能化的分析定界,将优化工作的响应和处理时间缩短92%,工作效率得到显著的提升,如图10所示。

图10:业务恶化工作处理效率对比

广西联通目前基于重点业务感知监测分析机器人的部署,为微信、王者荣耀游戏、淘宝、腾讯视频、新浪微博等多个重点业务提供监控保障,累计处理了32起因业务性能突发恶化而影响用户感知的事例,有效提升了对突发性问题的应变能力和响应能力,其应用效果显著。

智能网优的探索与展望

未来在AI+网优智能化的应用场景有着广大的开拓探索空间,结合不同的机器算法特点可用于智能场景的覆盖评估、智能动态阈值隐形故障挖掘、场景的参数智能优化、智能业务或负荷预测、基站画像管理等应用领域。从而借助AI以充分利用网络大数据资源,发掘内在规律,持续改进服务质量、提升优化效率,广西联通以“聚类算法管理小区业务画像”、“基于MR-MDT数据发掘小区天馈问题”的应用场景作为试点,对网优智能化应用场景进行持续探索研究,其成果初显成效。

(1)基于聚类算法的流媒体业务的小区画像管理与重点监控保障

结合集团所通报的2I流媒体业务播放小区列表,基于SPSS Modeler大数据分析建模软件对流媒体播放次数进行“K-Means”聚类分析,最终按播放的多少来划分“高”、“中”、“低”三个类别。如本次聚类有319个小区(播放次数>=185)的播放次数比较大,定义为“高”类别。对某地市为“高”类别的流媒体业务小区试点进行重点监控和保障,累计完成12个重点小区性能恶化问题(如故障告警,高负荷均衡等)的高优先响应处理。通过聚焦重点业务小区的感知保障处理,有效避免潜在的用户投诉和维护网络口碑。

图11:基于聚类算法的流媒体业务的小区画像管理

(2)基于MDT_MR大数据发掘基站小区天馈问题

基于爬虫获取场景图层信息,结合地理、工参、MDT等数据,建模计算出用户位置与正北方向的夹角∠θ,与小区工参天线方向角∠α对比,通过异常的偏差以挖掘用户位置是否在天线合理范围内。对某地市试点累计发掘了17处疑似天馈异常问题并现场验证,其准确性为70%以上。

图12:基于MDT_MR大数据发掘基站小区天馈问题原理

结束语

广西联通基于前期积累的网络优化经验,积极探索机器学习、软件编排等技术,通过开发的“重点业务感知监测分析机器人”实现了15类重点业务感知的智能洞察与优化分析,为未来的网优智能化转型进行了积极探索,具有一定的推广价值。

参考文献

[1] 薛毅,陈立萍.统计建模与 R 软件[M].北京:清华大学出版社,2007.

[2] Ziebarth N L,Abbott K C,Ives A R.Weak population regulation in ecological time series[J]. Ecology Letters,2010,13( 1) : 21-31.

[3] Dianjun Fang;Yin Zhang;Klaus Spicher. Forecasting accuracy analysis based on two new heuristic methods and Holt-Winters-Method.2016:1-6.

作者:陈若炜   张鹏  程乔 王映华
 

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141