专题
`
2013/7/19 16:14

E2E 100G OAM:100G规模商用的基石

0
0

作者:李俊安,华为技术有限公司,解决方案及网络设计部

随着100G技术的成熟及大量部署,成本不再是主要问题,业务的快速保护及故障的快速定界和定位成为主要挑战。通过路由器和传输的OAM(Operation Administration and Maintenance)协同技术解决了骨干网故障定界和定位的难题,并为快速保护倒换奠定了基础。

一、100G规模商用的趋势和挑战

成本将不再是100G规模部署的首要问题

随着Web2.0时代的到来,尤其是视频在互联网上的快速蓬勃发展,全球网络流量呈现出一种爆炸性增长的趋势。据互联网流量监测机构Telegeography发布的最新报告显示,全球互联网流量已经连续两年增长62%。而目前的2.5G和10G端口已经远远不能满足未来网络的需求。在运营商骨干网络,100G已经开始部署,并逐渐成为建设的主流,100GE的成本下降很快,因此成本将不再是运营商关注的首要问题。传送和数通融合的网络中,如何快速故障定界、定位的运维问题成为100G网络建设的首要挑战。

可靠性和运维依旧是100G时代骨干网的主旋律

运营商骨干网络由核心路由器和长途波分共同构成,两者基本是由不同的部门进行运维和管理。一旦骨干网络出现故障,路由器和波分设备可能都会有所动作,会导致整个网络告警泛滥,业务恢复速度慢,给骨干网络承载的所有业务带来灾难性的影响。

图1:以太接口对接故障模拟分析

如图1所示,如果在线路A存在信号劣化,并达到影响业务的程度,由于波分对业务层不感知,误码引入点将很难定界和定位;如果B点出现故障,由于OTN和以太属于不同的技术领域,OAM上是分离的层次,故障无法传递,将导致路由器的业务不能快速触发保护,从而影响用户的业务体验;如果在C点出现故障,由于是以太域,OTN无法感知和传递,存在单通的可能。以上故障现象都给骨干网的运维带来巨大挑战。

100G技术及标准现状

目前路由器100G速率端口没有定义POS接口,IEEE802.3ba标准只定义了100GE接口,。传送技术中,OTN(G.709)也正逐渐取代SDH/SONET成为新的传输网络标准,这就意味在100G时代初期阶段,路由器和波分之间是两个OAM领域,将无法达到10G/40G网络的OAM能力(路由器POS接口+SDH+WDM)。虽然以太网技术已经被广泛应用,并且成为整个通信网络中最重要的技术之一,但是以太网在OAM维护方面的能力一直比较薄弱。

虽然目前有很多OAM标准,比如以太OAM有802.1ag、Y.1731、802.3ah,MPLS OAM有Y.1711,OTN OAM有G.709等,但是各个技术领域中的OAM技术在实际网络中需要分层、分段部署才能实现E2E OAM技术的覆盖。而且,各领域OAM标准缺少体系化的互联互通机制,各厂家产品支持的标准完备程度不一致,无法形成完整的E2E OAM方案,导致在故障检测、定位、定界中存在各种各样的盲区,极大地降低了网络的运维效率,增加了OPEX。因此,运营商需要一个完整的E2E OAM方案来克服这些困难。

也许有人认为802.1ag(IEEE提出的一个用于Carrier Ethernet网络中进行错误管理的标准)和Y.1731(ITU-T发布的关于以太网OAM的建议书)均是端到端OAM的标准,因此提出路由器和波分设备均部署这两个协议之一的办法。但是我们必须注意,802.1ag不支持性能检测,对性能劣化类故障不能进行准确定位;并且802.1ag不支持AIS,不支持告警抑制,当大量VLAN的CCM(Continuity Check Messages)报文存在时,会出现大量告警;最后,CCM用于保护倒换的场景下,发送周期为3.3ms,对路由器的硬件要求非常高,因此成本高。

Y.1731虽然弥补了802.1ag在性能检测上的不足,却仍然无法完成以太链路的性能故障定位,比如出现丢包时,无法准确定位到是Router A侧的以太链路丢包还是Router B侧的以太链路丢包。

因此,100GE接口要想在骨干网得到成熟广泛的应用,其OAM能力必须要有所改进,对端到端跨技术领域实现快速故障通告,故障告警指示,误码性能监测和性能数据统计。

二、100G网络的E2E OAM方案

802.1ag+Y.1731_AIS 方案

图2:802.1ag+Y.1731_AIS 方案

如图2所示,802.1ag和Y.1731_AIS只在路由器和波分之间部署,波分网络仍然利用G.709 的OTN OAM能力,并且波分设备支持OTN_AIS到Y.1731_AIS的映射转换,以及CCM的RDI到OTN_BEI的映射。当图中A点出现故障或丢包时,WDM1可以检测出来,并将此结果象传递接力棒一样,一直传递到路由器A,这样就实现了端到端的故障传递,从而为快速保护倒换奠定了基础。

这种方案要求路由器,波分设备支持以太网OAM技术,并且波分设备要支持OTN告警到以太OAM AIS的转换。部署时,需要在路由器及波分设备上的各个OAM维护点进行相应的OAM配置。

Local Fault/Remote Fault方案

图3:Local Fault/Remote Fault方案

如图3所示,路由器采用IEEE 802.3ae(10GE)和IEEE 802.3ba(40GE/100GE)标准中定义的以太PHY层故障通告码流Local Fault(简称LF)/Remote Fault(简称RF)功能,波分使用OTN的OAM与LF/RF联动实现E2E OAM能力。在发生故障时,波分会根据故障位置,对封装进ODUk时隙的以太信号增加PHY层LF码流,和透传RF码流。路由器在收到LF/RF时,会快速触发路由器的保护倒换。

这种方案需要路由器支持LF/RF检测,波分支持OTN告警和LF/RF的联动。但是这些都是设备本身硬件自动完成的,默认支持,并不需要额外进行特殊配置。其端到端的故障通告速度也是非常快的。

各路由器及波分厂家推出的100GE接口,必须支持IEEE 802.3ba标准中的LF/RF功能,以实现多厂家互通时的端到端故障通告。华为路由器和波分产品当前都已支持了10GE/40GE/100GE接口的LF/RF功能。

LF/RF方案是当前易部署的E2E OAM方案,并且有较好的故障通告性能。该方案完全可以替代BFD和LPT实现端到端故障快速通告,触发路由器的快速保护倒换。

三、E2E 100G 网络的故障定界及定位

目前多数运营商的骨干波分和骨干路由器是分开维护的,而且每天面临着海量的告警信息。以欧洲某运营商为例,每天波分层面的告警有6000多个,而路由器层面告警有2万多个,导致根源告警被淹没,无法及时找到告警根源并定位问题。

图5:跨层故障定位

如图5所示,通过结合以太LF/RF告警和OTN告警,在发生故障时能够通过唯一的告警列表,判断和定位故障点发生的位置。华为统一网管U2000可以实现路由器与波分网络的统一管理,通过跨层告警的根因分析,快速向客户显示引起网络故障的根因告警。

四、华为产品已实现100G网络规模商用

华为路由器和波分产品充分利用现有的以太网和OTN OAM技术和标准,在数通和传送网络之间架起了一座互通的桥梁,消除了OAM盲区,真正实现了骨干网络的端到端OAM。结合华为统一网管,极大地提升了运营商的运维效率,降低了运维OPEX,为运营商骨干网络的可靠运维奠定了坚实的基础。

华为100G路由器和波分已经在全球多个领先运营商的骨干网络中进行了部署, 成功合作通过了严格的100G OAM互通测试

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销