黄兵明(中国联通网络技术研究院),郭慧峰(中兴通讯股份有限公司),赵 良(中国联通网络技术研究院),薛金明(中国联通江苏省分公司)
本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘 要:重点探讨了人工智能在通信网络故障溯源方面的应用研究和相关案例。首先介绍了目前网络运维的现状和国内外研究进展,结合通信网络运维中的实际业务和问题总结了多个应用场景,并针对所有场景提出了故障溯源整体解决方案。最后重点分析了中国联通IPRAN网络告警根因案例。该案例的实践效果说明了人工智能应用到网络运维中可以帮助运维人员快速定位根告警和故障源,提高运维效率。
关键词:人工智能;故障溯源;关联规则;IPRAN;PrefixSpan算法
doi:10.12045/j.issn.1007-3043.2018.12.008
概述
全球运营商相继发布网络演进和转型战略,希望能够通过引入SDN/NFV、云计算、区块链、5G等新技术,减少对专有硬件的依赖,实现新业务的快速部署,满足用户多样化的需求,提升核心竞争力。但在转型过程中通信运营商面临着多种挑战,一方面是联网设备数量快速增长以及设备之间沟通产生的数据洪流,另一方面是随着电信网络设备日趋虚拟化、自动化和智能化,网络复杂度指数型增长。这些挑战无疑使网络运维变得日益繁杂和困难,运维人员一方面必须面对各种高度集成设备产生的大量实时信息,另一方面需要处理海量的告警数据,并且为了不降低用户感知,需要快速解决问题。现有的系统已经无法在异常状况发生时为运维人员提供足够的支持,导致许多问题不能被及时发现而不断传播升级,直至影响所有业务。如果发生异常告警时需要花费大量时间去寻找问题根源及解决办法,那么即使是细微的问题也会迅速地升级扩大。
人工智能(AI)的发展可追溯到1956年达特茅斯会议(DartmouthConference)[1]。人工智能可以定义为机器能够实现的智能,是与人类和其他动物表现出的人类智能和自然智能相对的概念。也可引用“人工智能之父”MarvinMinsky对人工智能的理解来定义它—“人工智能就是让机器来完成那些如果由人来做则需要智能的事情的科学”。网络人工智能(NetworkAI)[2]是将人工智能技术应用在网络中,使用机器替代或优化目前依靠人工进行的工作,使运营商能够更加便捷地提供更加优质的网络服务。
本文以人工智能技术为基础,结合现有网络运维技术,提出故障溯源整体解决方案。希望通过对告警信息进行合适的过滤、筛选、匹配、分类等流程确认告警信息,并根据各个告警之间的关系来进行告警溯源,屏蔽不重要或衍生的告警,实现对网络故障的快速诊断。同时配合相应的通信业务模型和网络拓扑结构实现故障的精准定位。最后通过实践中的具体案例分析,给出人工智能应用于网络故障溯源的结论和展望。