C114通信网  |  通信人家园

技术
2017/9/11 14:19

SDN和白盒交换机漫谈

SDNLAB  

一、SDN和白盒的关系

经典SDN的定义是转控分离,通过SDN控制器来实现集中的网络智能控制,并通过北向API来提供快速的应用迭代开发。随着产业界的博弈,所有通过集中的软件来实现业务发放的系统也被称之为SDN。而白盒则是不折不扣的过去三十多年PC技术路线在网络产业的实现,通过标准化硬件的SAI接口,将网络设备的硬件和软件分离,客户可以从A厂商买硬件盒子,从B厂商买软件或自行裁剪开源软件系统安装在A厂商的盒子上,自己组装一个可运行的设备。

某种程度上来讲,经典的SDN也是一种白盒的实现方式,只不过软件系统和硬件盒子不是1:1而是1:N的关系,和Software Defined Storage类似。下面两张图来自于SDN/OpenFlow之父Nick Mckeown早期SDN布道的经典胶片,其愿景是采用SDN塑造一个没有Vendor LockIn的开放新世界,其后OCP/TIP(Telecom Infrastructure Project)项目推进白盒采用了不同的方式,但是目标远景完全一致。

SDN的技术路线仍然百家争鸣,随着电信运营商的加入,希望扭转过去20年推动网管接口开放不利的局面,借SDN之东风来开启网管的第二次开放性革命,这使得SDN的概念更加模糊不清。

SDN和白盒的初始驱动力是一致的:

● 避免Vendor的LockIn,使得商务和技术的主动权掌握在客户自己手里,避免店大欺客的现象。尤其是近二十年来Google等顶级互联网公司不仅商业上极其成功,而且也将商业成功和技术成功紧密关联起来,这使得电信运营商有意无意地以互联网公司为榜样,希望逐渐加强自身在技术上的控制力,像互联网公司一样分分钟推出新功能,满足最终用户的需求。

● 降低成本,这是第一点带来的好处,有多个同质化、可替代的供货商,那么商务价格就好谈,降价是可以预期的必然结果。

但是两者的产业现状差异较大,SDN已经完全脱离起初的定位,成为一个完全泛化的新型网络技术的代名词,各个玩家都能从其中找到自己的利益定位,故而已经广为业界接受,但是仍然在产品形态、商业价值上不断受到质疑。白盒是个非常具体化的产品形态,虽然有完全白牌、品牌白盒(Branded White Box)的定义差别,但是无关大局,其对既有的产业格局冲击巨大,所以多是弱势厂商、IT类公司或者初创公司参与,既有优势网络厂商迎合客户推出1-2款白盒已经是极限。

Google、Facebook、国内等大型互联网公司有足够大的交换机采购量,也能养得起自己的研发队伍来研发交换机软件,并对技术兜底,因而推动白盒不遗余力。以Facebook为例,其2011年牵头推动成立OCP(Open Compute Project),主要聚焦于开放数据中心基础设施架构,2013年成立Open network子项目,定义交换机的硬件和芯片SAI、版本管理(ONIE)标准,自己研发FBOSS网络操作系统,从而使得交换机硬件完全可以替换。在电信领域,2016年同样是Facebook牵头、多家运营商参与的TIP project的成立使得白盒在运营商领域得到高度的关注;AT&T 2016年首先宣布CPE的白盒计划,今年4月又宣布计划在未来大量采用白盒来构建Backhaul网络。几乎每个欧洲Tier 1运营商都在NFVI的标书中轻描淡写地提到OCP兼容硬件的路标支持,也有部分运营商,如TEF等运营商也悄悄向厂商发了白盒的标。

二、以史为鉴

中国先贤曰:“以史为鉴,可以知兴替”,圣经传道书曰:”There is Nothing new under the Sun”。

1981年,IBM推出了个人计算机,搭载着来自Intel的8088 CPU和微软的DOS软件系统,开启了PC产业的序幕。在此之前,IBM的大型机份额已经从1970年的60%降低到1980年的32%,IBM自身的营收增长率仅为5.3%,同期DEC的增长速度为35%。有鉴于此,PC作为一个被IBM寄予厚望的产品而上市,而不是像今天一线网络厂商对于白盒/SDN的天然抵制态度。

即使如此,在企业计算领域,大型机和小型机仍然长期牢牢占据了市场主导,直到1995年Intel Pentium Pro的发布,才使得PC架构逐渐进入高端企业计算领域,但是CISC/RISC体系架构孰优孰劣之争一直未曾停息;Intel和HP合作的Itanium耗资巨大并不成功,直到2005年多核X86 64发布,对RISC Server的替代才进一步加速,DEC Alpha、Sun Ultra Sparc逐渐式微;微软在90年代初几乎一锅端了DEC的VMS团队启动研发Windows NT,经过了NT 3.1/3.5/4.0,直到Windows 2000 Server发布,才进入企业计算的主流市场。

在网络领域,以承载语音业务为主的电信网络在20世纪80年代完成了从人工交换到机械电子交换乃至软件控制的更新换代,90年代开始从随路信令过渡到共路信令,有了独立的面向呼叫控制的信令网络。这是因为电信网络面向运营,可管可控、可集中计费、对账是关键的诉求,这也为90年代末软交换的控制转发分离奠定了基础,软交换通过MGCP/H.248协议提供简洁的端点、上下文抽象控制模型,将控制和媒体转发面分离;在IMS时代,ETSI/3GPP引入了RACS、PCRF实体来实现业务流级别的策略控制。在移动网络中,2G时代就将用于数据管理和认证控制独立出来设立HLR网元,R8 LTE阶段将分组域的移动性管理独立出来设置MME网元。因此从电信网的历史和运维习惯而言,对SDN的集中管控更容易接受。在业务开通方面,电信业从上个世纪90年代开始就开始了自动化的BSS/OSS系统的建设,从起初的从营业厅到后台的人工审批、执行的工单系统,很快变成用户完全可以自服务进行业务订购、开通的端到端自动化的系统,我们今天的移动业务、固定宽带业务基本上都可以通过运营商的网站、App进行自服务开通、实时生效。而在企业专线业务上,尤其是跨地域的VPN专线,涉及到运营商内部多个经营实体的结算、协调问题,端到端自动化开通仍然困难,但是与总量占80%~90%的个人业务相比,此部分业务量相对较小,解决的推动力不足。从统计数据来看,过去10年来,企业专线IP业务在总的IP业务量中占比不是上升,而是进一步下降。

在传输网层面,从上世纪90年代开始PDH演进到SDH开始,由于SDH的多站点的电路分插复用网络架构,站点上下电路业务需要统一的资源管理和配置,所以SDH一开始就引入了集中网管的架构,除了对电路分插复用的集中规划配置外,也利用了PDH本身的OAM能力来对多站点进行统一管理;传输网管再往MSTPOTN的演进过程中进一步具备了端到端路径计算的能力,从而实现了自动化的电路业务开通能力。

与电信网不同,IP网一开始起源于ARPA NET这样的军方项目,其网络在灾难下的生存性是第一设计原则,所以一开始走的就是全分布的路由技术路线。Ip协议在1980年RFC760中才正式从TCP中独立出来,在1982年引入GGP/EGP控制面协议之前,TCP/IP网络并无独立的控制面,即使是EGP的后继BGP、还是RIP/OSPF/ISIS等各类IGP协议甚至是LDP、RSVP/RSVP-TE这类虚电路管理、标签交换协议,仍然维系了分布式路由交互的架构。稍微有点不同的是,iBGP这样Full-Mesh连接的协议在大规模网络中其扩展性受限,IETF于1996年的RFC1966中引入了集中的Route Reflector角色,这也使得采用BGP协议的集中控制成为可能,包括采用BGP RR进行集中的路由策略控制以及流量的调优。IP的全分布式架构深入人心,因而从业者往往无法接受经典SDN的集中式控制架构。

三、未来趋势走向探讨

古希腊哲学家赫拉克利特曰:”人不能两次踏进同一条河流”,莱布尼茨也说”凡事莫不相异”。

3.1 白盒

在网络产业中,领先厂商均极力避免重蹈PC白盒化的覆辙,避免两次踏入同一条河流,并且今天网络的产业环境也和PC兴起的时代极为不同,1980年代个人计算机普及率几乎为0,潜在的巨大增量市场可以养活任何形态的产品,而今天的网络产业已经趋近饱和,任何形态的产品必须以对他人的替代为前提,新品的竞争优势必须明显;网络行业分客户除了那些自己能够玩票的顶级科技公司以外,两类大客户接受白盒仍然存在很大的障碍:大部分行业政企客户网络只占IT设备其中的一小部分,服务器/存储是大头,即使在网络部分,安全甚至可能大于交换机和路由器成本,但是网络又非常重要,故障后果非常严重,对采购决策者而言采购知名品牌比白盒的潜在风险小得多。对于大部分运营商而言,网络复杂,网络设备功能相对复杂,并且有冗长的市场准入测试周期,售后服务要求苛刻、付款周期长,而当前白盒生态链中大部分为创业公司户的情况,参与这个市场还非常困难。

另一方面,近年来运营商迫于营收、成本的压力还是在有意扶持白盒这个市场。过去5年,全球IP网络流量增长了约2.2倍,其中移动网增长12.6倍,而同期电信业务收入反而下降约3%,运营商增收、节支的意愿强烈;有互联网公司作为榜样,那么最好的方式就是撸起袖子来自己干。虽然讲自己动手违背了按比较优势分工的基本经济学原则,但是由于IT技术普及的今天,IT、软件已经成为每个大型企业的基本专业,开源也使得软件组件似乎唾手可得。未来每个公司首先都要是个科技企业,就如同数十年前开车还是个专业化的活,今天已经成为每个个人的必备技能一样。运营商的问题是由于历史原因以及监管的要求,是其组织模式还是按地域分隔,大部分无法像全球化的互联网公司那样聚焦人才优势、聚焦方向进行快速技术创新。

从网络的形态来看,Metcalfe定律讲网络的价值和用户数量的平方成正比,同样一个有状态的网络的复杂度也和终端数量的平方成正比,复杂的有状态网络扩展能力差,这也是过去数十年IP战胜ATM等技术的根本性原因之一。将业务和传送分离、边缘和核心分离,将智能留在边缘、核心简化(Smart Edge, Dumb Core; Soft Edge, Hard Core)才是应对未来海量连接、数据洪流时代的网络的正确姿势。在数据中心内部,vSwitch和智能网卡将网络业务起点放在了服务器上,Fabric网络是个简单的可扩展的CLOS架构网络;在运营商网络,移动网是基于IP及传送网之上的一个Overlay,固网接入架构也非常可能沿着类似的架构演进,Overlay起点放在uCPE、OLT上,另一端终结到边缘DC,边缘DC到核心DC还是Overlay,这其中的城域网、Backhaul、骨干网都可以尽可能简化;虽然OBS/OPS这样的光交换技术过去十几年进展不大,但是ASIC转发+WDM技术还是可以对付越来越多的场景。简化的结果使得对Underlay的设备要求降低,也降低了白盒设备参与运营商网络建设的门槛。

但是如前所述,今天网络已经是个高度饱和的市场,供应商利润也在持续下降之中,过去5年运营商交换/路由/传输网络设备市场几乎零增长,企业交换/路由设备也步入了负增长通道,无法像PC产业发展早期的高成长来快速孵化一个全新的产业链。从经济规律来看,无论是谁都逃脱了不了市场经济下的供求关系铁律。卖价过高,必然使得新进入者有利可图、卖家也积极扶植、寻求新的卖家;卖价过低,无利可图,供应者减少,又导致价格回升,所以长期来看价格应在平衡点上下波动。当前阶段网络设备领域主流供应商日趋集中,个别卖家的议价能力上升,客户虽有意扶植白盒产业链,但是由于整个产业的利润并不高,白盒产业很容易遇到阶段化发展天花板,很可能最终在某个TCO均衡点上获得一个相对稳定的市场份额, IHS Markit给出的预测数据是到白盒交换机端口发货量从2015年的10%增长到2021年的19%左右。

3.2 SDN

Software Defined Networking今天不仅是一个网络的概念架构、更是一个Marketing术语,就如同2010年左右的云计算一样。其从一开始的集中控制面到业务的自动化、再到运营商网络的网管开放化运动都聚集到SDN这个大旗下,使得其概念外延不断延展。

SDN应用场景可以归结为点、线、面三种类型,所谓点就是侧重于单点设备的转控分离,一般用于用户的接纳控制和管理,此类应用在以往的网络中包括固网BRAS+AAA、移动网EPC、企业网/WLAN 802.1X认证等产品或技术已经广为部署,归为SDN是概念包装,也是产品组合改良,比如对园区网的集中管控;线则是基于路径计算的专线开通和路径优化,包括各类运营商网络从回程网到骨干网、从IP到光层的SDN以及SDN早期Google B4的流量调优;所谓面则是将用户/应用的虚拟网络设计自动化映射到物理网络,包括数据中心网络的虚拟化,以及还在讲故事的5G网络切片,后者虽然其技术上已经不是问题,但是价值很大程度上还是停留在纸面上。

数据中心的网络虚拟化基于SDN,由计算虚拟化驱动,无论其是何种SDN除了技术路线之争外,应用价值已无大的争议;SD-WAN由于企业专线和普通Internet接入的价格剪刀差,加上企业对于网络服务化的需求、Overlay技术带来的端到端便捷开通特性,使得其在近两年大热。其它场景的价值业界一直在寻找、一直在争论,从未停息。几点看法:

1、随着经济发展,除了土地等不可再生稀缺资源外,人力几乎是唯一单调上升的成本要素,个体追求时间自由也是永恒不变的诉求,因此所有可以自动化、减少人力投入的技术都不会错;网络的自动化业务发放、智能化运维技术会持续演进、深化,在成本可控的前提下不断增强从网络采集运行统计数据的能力,用于网络质量分析、规划参考乃至用于网络自愈控制。这些可以和SDN无关,也可以有关,也可以包装成AI Based Network,就看需要扛哪杆大旗。

2、有人以GPS导航来实现最优路径的选择来类比网络的流量调优,的确从理论上来讲,如果进入网络的每个报文我们都可以为其选择最佳路径,则是一个最为理想的网络。但是差别在于,路依附于土地,是极度稀缺的资源,而网络主体基于硅元素,虽然不完全可以摩尔定律化,但是调优技术本身引入的成本和扩容带宽的代价是可以比拟。另一方面,在GPS导航系统中,是每个车辆自带导航,云端系统汇总路径拥堵程度来进行单车的精准调度,而路本身并无状态,不会带来严重的可扩展性问题。与此类似的是Segment Routing这样的技术,从路径头节点携带标签栈表达的源路由,中间节点无状态转发,加上SDN控制器算路,非常类似于导航系统。但是问题是地图信息公开市场可以购买、也可以自己测绘,同时人的行程是有限的,任意网络导航服务提供商都可以获得近乎端到端的路网信息,但是网络世界是割裂的、分属于不同运营商的私产,而业务是端到端的,局部的优化对端到端的体验改善很难预计,这就有点尴尬了,就好比过去十几年我们谈的智能管道、端到端QoS保证。但是在局部可控的范围内进行优化,尤其是高价购买、租用运营商网络,且有刚性预算的大型企业客户来说是可能的。

3、产业买卖双方的博弈,尤其是在通信市场接近饱和的情况下,甲方消除厂商锁定、提升自身商务、技术两个层次控制力的诉求,通过SDN来推动转发设备和网络业务功能的分离,这其中其实基础网络提供L2/L3的连接性只是一小部分,还有安全、负载均衡等等网络增值服务。这和白盒的驱动力比较类似,如果网络设备不能通用化,那么就将更多的网络功能转移到更加通用的X86上。当然,天下没有免费的午餐,开放意味着责任界面的多样化、复杂化,封闭意味着交付的简单化,同时基本相同的硬件设计也意味着其成本主要和出货量相关,开放/封闭本身倒非主要因素。

四、结束语

无论是SDN也好,白盒也好,都是硬件资源供给相对丰裕之后的软硬解耦的大趋势,产业价值向软件进一步转移不可避免。在半导体制程接近原子直径之前,CPU的性能持续增长还有一段时间,X86在下有ARM蚕食低端市场、上有GPU主导高性能计算的竞争环境下,很重要的市场机会就是往网络方向进军,包括X86自身转发的优化以及附加FPGA协处理器、智能网卡外设等,这使得稍微带一些通用处理的网元都可以采用通用X86服务器来实现;另一方面ASIC也向可编程方向发展,在保证高带宽的前提下获得一定的灵活性。两者共同挤压NP、多核处理器以及厂家ASIC芯片的市场空间,最终网络设备架构很可能统一到X86和ASIC这两个生态链上,消除以往网络设备产业碎片化的状态,平台变得更加通用,而通用使得单一生态链的价值扩大,从而使开放真正经济上可行。

开放网络比较乐观的结果是开放的生态链会吸引更多的参与方,而更多的参与方、分层解耦体系可能意味着创造力的释放,带来一个新的网络繁荣时代,希望那时我们不是白垩纪晚期的恐龙,而是已经为新生代到来准备好生存技能的哺乳动物。

作者简介:汪军,毕业于南京航空航天大学,硕士研究生学历。目前担任中兴通讯承载网产品线SDN规划总工,此前先后在中兴从事核心网产品研发、平台规划以及下一代网络研究工作。在2004年加入中兴之前,供职于安徽芜湖电信,先后从事网络运维、规划以及市场等工作。

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2024 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141