5G的渗透率不断提升,尽管DoU(平均每户每月上网流量)增长了6倍,但是5G的繁荣并没有为运营商带来显著的营收的提升。因为传统基础业务已经严重同质化,加上“提速降费”的要求,以“卖流量”为典型的传统业务已经连续多年增量不增收,想通过传统业务实现持续大幅度增长更是希望渺茫。
AI、云计算、大数据、物联网、量子计算等新技术层出不穷,牵引运营商数字化转型投资,但由于各运营商投资密度的不同,数字化转型的进展也参差不齐。基于2022年全球运营商的营收数据,生成了两种画像,其一是“稳健派”,仍以卖管道的传统基础业务为主,围绕网络开展1+N创新增收,数字化业务还未形成经济效益,其整体营收增长乏力,数字化业务甚至出现负增长,例如美国AT&T、德国T-mobile、新加坡Singtel等;而另外一种“卓越派”,则已经开始享受数字化转型投资的成果,多样化的新兴业务诞生,牵引业务主战场从传统ToC走向ToB,带动整体营收高速增长,例如中国三大运营商、韩国KT、日本KDDI、泰国Ture等。
真相1:基础业务增速慢,数字化转型收入才是运营商增收最快引擎
2023年国务院印发了《数字中国建设整体布局规划》,加速推进数字中国进程,目标2035年进入世界前列。而运营商作为数字中国建设的主力军,一直处在数字化建设的最前沿。基于工信部发布的《2023 年上半年通信业经济运行情况》以及2023H1中国运营商财报,“卓越派”运营商2023上半年的成绩单如下:
1、传统基础业务增速疲软:在全球运营商营收增幅停滞不前的大环境下,中国运营商整体营收实现增长,但其中,固网、移动、语音等基础业务增速缓慢,仅有2~3%,远低于运营商整体的营收增幅。
2、产业数字化收入增速快、占比提升:运营商数字化转型收入保持双位数增长,占整体收入比例也不断提高,其中移动提升至29.3%,电信提升至29.2%,联通提升至25%。这其中包含了以移动云盘为代表的ToC市场新业务,以IPTV为典型的家庭市场智慧家庭增值业务,以及ToB政企市场DICT、物联网、专线,以及AI、云计算、视联网等新兴市场收入。
谎言2:“云改”浪潮袭来,运营商云化改造驱动业务与数据全部上云
运营商云化改造有两个目标:1、对内实现降本增效,现网ICT基础设施建设和运营厚重,需要用云化架构提升资源利用率,为ICT瘦身降本。2、对外赋能千行百业,通过云服务的方式打造产业级服务体系,承担整个社会数字化转型的责任,助力数字经济社会的数字化、数智化转型。
云化落地过程中,CRM、Billing这类数据库稳态核心业务仍然保持在线下部署,满足高性能低时延要求,但如开发测试、Web Server等敏态业务,对资源敏捷弹性的要求更高,应用生态贴近云原生,更适合在云端部署。那么问题来了,业务部署在云端后,数据是否也要跟着存放在云端呢?
真相2:捍卫数据主权刻不容缓,关键数据汇聚线下才是云改的最佳选择
全球各国纷纷打响“数据主权保卫战”,因为数据不仅已成为AI、大数据等新业务的生产资料,也是企业核心资产。“钱存自家金库,还是分散到各地存放?”,这个问题要参考四个关键因素:
1、法规要求数据不出国:多国陆续出台了数据保护法(欧盟GDPR、中国PIPL、巴西LGPD、南非POPI),明确数据不出国。如果企业违反了数据法规,可能会招致巨额罚款及其他法律后果。2023年5月,由于怀疑社交媒体平台Facebook将欧盟用户数据传输到美国,欧盟针对其开出违反隐私法规的12亿欧元“天价罚单”,并命令该公司在今年10月前停止将欧洲用户的数据传输出国。无独有偶,2022年欧盟也对AWS和中国企业TikTok开具过同类的罚单,欧盟GDPR因此也被称为“史上最严苛数据保护法案”。
2、公有云数据主权模糊不清:2018年美国通过“CLOUD法案”挑战数据主权,要求美国的企业提供公司控制的数据,无论数据存储在何处。例如,美国政府要求微软提供存储于爱尔兰的电子邮件。此方案遭到全球多国抵制,并表示需要通过主权云方式取代美国AWS、Azure、Google等云服务商。
3、公有云数据存放成本高:随着应用数据量变大,云存储服务的成本会逐渐超越自建存储成本,以3年周期为例,数据存在本地的成本仅为云上成本的50%(本地$0.1/GB vs云上$0.22/GB),例如抖音、拼多多等企业都在数据规模化后触发了云上数据的回迁,但高昂的云数据回迁费用,使得“上云容易,下云难”已经成为共性的痛点。
4、第三方公有云之间的数据不共享:每个云厂商的优势云服务领域各有千秋,例如AWS的容器、区块链,Azure的Teams、office,但是各家公有云的数据壁垒意识很严重,数据无法流动和共享。没有可共享的数据,各有所长的多云应用也用不起来。
综上所述,运营商云化演进过程中,既要享受云应用带来的便捷,又要考虑数据的安全和中长期使用成本。所以,符合云化演进的最优架构应该是:应用在云端部署,本地同步改造;数据本地存放,按需脱敏上云。如此,安全、可靠、合规的专业存储,就是数据本地存放的最佳“保险箱”。
谎言3:公有云创新高效,运营商将携手第三方公有云实现“双赢”
全球公有云厂商的都有自己的创新高地,例如AWS庞大的工具集、Azure的混合云交互、Google Cloud的AI与数据分析等。企业可通过“多云”组合使用来实现创新高效,根据统计全球89%企业有多云战略规划,企业正积极拥抱多云,在多云世界中加速创新。但是,与大部分企业直接长期使用公有云支撑业务演进不同,运营商主要依托本身的渠道优势,以第三方云服务转售这种“赚快钱”的方式为主,例如Verizon、德电DT、Globe、True等运营商热衷于转售AWS的DevOps、大数据等云服务,同时也带货微软的Teams、Office 365等主流的办公协同云服务。
为什么运营商不青睐长期使用第三方云服务呢?
因为,大型运营商的目标是成为公有云提供商。TOP运营商依赖遥遥领先的5G网络技术、成熟的大规模基础设施、国家政策的加持等优势,已经赢在“云服务”的起跑线上。以中国运营商为例,国资委在《中央企业深化专业工作会》上指出,运营商将是国家基础设施的建设者,统一面向全社会提供资源。三大运营商依赖独有“云网融合“能力,同时匹配国家“东数西算”战略,承载国家云数据中心建设,通过自建公有云并以云服务ToB的方式赋能千行百业,加速各行业数字化进程。
真相3:狂飙的运营商三朵云,已成为中国公有云的最大玩家
1、公有云投入持续加大:运营商云服务ToB业务的投入逐年升高,以国内某运营商为例,2023年产业数字化投入(含云服务)已占比总体投入的38%。
2、三朵云营收高增长,进入市场TOP5:中国运营商在自建公有云的高额投入,也得到了积极的市场回馈,云服务营收走向“正循环”。根据2023年H1财报,三大运营商公有云市场增长迅猛,其中天翼云收入459亿¥,增长高达81%,与长期霸榜TOP1的阿里云收入497亿¥接近,2023全年天翼云挑战 “千亿”收入目标不动摇,有望抢夺中国公有云收入榜首。紧随其后的移动云、联通云营收增幅分别达到63%、36%,增速远超行业平均水平(8%)。23年H1运营商三朵云全员入围营收TOP5,进入中国公有云市场第一梯队,成功接棒互联网云,成为政务、教育、医疗等行业“央企国企上云项目”的公有云提供商。
谎言4:数据将进入YB时代,传统全栈服务器架构适用于构建数据底座
数据是云业务的基础,随着业务数字化转型,数据正在指数级增长,5G和云化驱动运营商用户话单量增长3倍,话单数量增长10倍。据 《数字中国发展报告》显示,截至2022年底,我国数据存储量达724.5EB,同比增长21.1%。运营商在打造符合云时代需求的数据中心过程中,这些海量数据的爆发增长让数据的高效存储成为一大难题。
我们发现,当前大规模云数据中心普遍采用服务器本地盘+分布式软件的存储方案,此方案的优势是轻量便捷,可帮助快速搭建系统,但随着数据量的暴增,这种存算一体方案在大规模的云数据中心并不适用。例如,大规模云数据中心拥有海量服务器本地盘,但服务器对硬盘不具备专业管理能力,当硬盘出现问题后,会导致响应慢、即将失效等故障,使得上层分布式存储软件进行重构时会耗费大量的CPU算力,对业务影响不可控。再比如,为了保障可靠性,通常采用3副本存储策略,即1份数据保存3份,存储空间利用率仅有30%,机柜空间和能耗占用大。
真相4:云走向分层解耦,Diskless是大规模公有云系统的最优架构
1、云数据中心架构已从封闭全栈走向开放合作。从技术趋势来看,先进的公有云系统架构已由全栈走向分层解耦(例如AWS、Azure),与业界最优的产品合作集成,分层建设,以开放的姿态找到业务的“最优解”。
2、基于Diskless无盘架构的专业存储,能够更好减少对空间、能耗的占用,并简化硬盘的管理运维。面向海量数据的IT基础设施,如何实现存力和算力按需扩展,也成为了运营商IT创新的关键。为此,以新型存算分离理念的Diskless架构应运而生。Diskless架构支持资源池化,把原有的多级分层资源,彻底解耦池化和重组整合,实现了各类硬件的独立扩展和灵活共享。例如,将服务器内数据盘拉远,将硬盘集中到专业存储中统一管理,通过专业存储厂商对的原生硬盘亚健康管理、三级硬盘慢IO快速响应等技术,屏蔽底层硬盘故障,保持大规模数据中心海量硬盘的可靠稳定,大幅降低运维难度。同时,再通过数据缩减、大比例EC等关键技术,提升存储效率,帮助客户提高资源利用率,降低机柜空间和设备功耗。
在中国,某头部运营商已经将Diskless存算分离架构用于智算中心的建设实践中,采用专业的存储重构私有云、公有云的数据底座,应用于ToB自动驾驶、工业智造、AI绘画等新兴场景,整体性能提升2倍,机房占用率降低40%,并且屏蔽掉硬盘故障带来的业务中断,运维更为省心省力。
谎言5:大模型引爆性能需求,运营商算力强则AI强
AI大爆发,运营商入局“百模大战”。据OpenAI预测,未来50%的人类工作任务场景将被ChatGPT影响。运营商作为信息通信基础设施的建设者和运营者,既为AI的发展提供基础设施支撑,又将会是AI应用落地的先行者。运营商在全面拥抱AI新机遇时,会充分发挥其既有的数据优势、资源优势、行业使能经验优势,全力打造领先的AI基础设施,依托算网融合的能力,让AI服务无所不达,从而引领产业发展。
广义算力 =算力&&存力&&运力。运营商要抓住大模型的发展机遇,首先需要构建领先的AI基础设施。大模型的参数和数据规模都呈指数级增长,除了对算力有极高的要求外,对存储的扩展性、性能、时延等都提出更高要求。比如一个训练批次前后的数据加载和保存阶段,如果存取性能不足,会导致宝贵的计算资源空转浪费。中国工程院院士倪光南指出“存力、算力、运力缺一不可,只有三者平衡配置、均衡发展,才能充分发挥算力的作用”。可以说,存力是算力价值的前提和基础。
真相5:缺数据无AI,存力加持算力才能构筑AI最强底座
数据决定AI智能的高度。大模型要服务千行万业智能化升级,数据质量、规模决定运营商AI的竞争力。作为数据的载体,AI存力为大模型注入源源不断的数据“燃料”,加装动力澎湃的数据“引擎”,提供坚实可信的数据“护盾”。
面向大模型场景,服务器存力不够用,通用存力不好用,需要量身定制的AI专业存力。AI技术的发展先后经历了传统AI时代、深度学习时代和大模型时代,所需的存力系统也不断演进。在传统AI时代,研究者们尝试使用符号和规则来实现人工智能,训练规模有限且数据多为结构化数据,存储方式为本地盘存储形式。到了深度学习时代,深度神经网络的训练数据多为文本、图片、音频等单模态数据,随着训练复杂度和规模的提升,需要统一的数据资源池实现数据共享,此时对数据IO性能要求不高,主要以对象存储为主。当前AI已发展到大模型时代,传统以服务器集群搭建的对象存储资源池已无法满足需求,比如某智算中心集群运行65B大模型时,1PB对象存储的读写带宽仅为2.4~7.5GB/s,导致训练经常挂死。面对万亿级参数、PB级训练数据的大模型,存力系统需为此打造专业的AI存储,通常需要构建“高性能层+大容量层”的AI存储集群,这样的存力系统业界称之为“AI先进存力”。
构建AI先进存力才能释放运营商最强“广义算力”。大模型的持续创新突破,需要从数据的角度对AI全流程进行优化,通过AI先进存力,将训练数据、行业专有知识库与大模型能力充分结合,实现以存强算,加速场景化大模型服务好千行万业。首先,数据归集阶段要高效处理多地域、多分支收集PB级多样化的原始数据;其次,在模型训练阶段需要对海量小文件的随机读取以及模型数据集快速保存;最后,在模型推理阶段需要快速检索增量源数据和向量数据。这些挑战都需要创新的AI存储解决方案,比如通过智能数据编织,实现跨系统、跨地域的全局统一数据视图和调度;通过近存计算,卸载部分数据预处理能力,减少数据搬迁,缩短数据准备时间;通过全闪存分布式存储,实现存储节点千万级每秒读写次数(IOPS,Input/Output Per Second)和数百GB/s带宽,提升训练效率;通过向量存储,实现高性能向量检索能力。
谎言6:“双碳”成为硬指标,运营商依赖“降PUE”实现节能减排
据GSMA(Global System for Mobile communications Association)2023年最新报告,全球已有62家运营商(占行业整体收入61%)承诺在2030年实现快速减排的目标。在“碳达峰、碳中和”大背景下,绿色低碳已成为运营商数据中心的重要发展方向,而PUE(Power Usage Effectiveness)通常被认为是评价数据中心能源效率的最重要指标。
PUE的计算公式为“PUE值 = 数据中心总能耗/IT设备能耗”,PUE值越低,说明数据中心非IT设备能耗越少,数据中心越节能。数据中心的用能部分通常包括IT设备、制冷系统、供配电系统及其它,以PUE为1.5的数据中心为例,其IT设备耗能约占67%,制冷系统约占27%。制冷系统是IT设备之外的最大耗能源,因此优化制冷系统,是降低PUE的主要途径。
一个PUE=1.5的数据中心中各组成部分所消耗电能占比
PUE的重要性毋庸置疑,但PUE并不能全面真实地评价数据中心节能情况。例如,通过节能技术提升IT设备效率,大幅降低IT设备能耗,数据中心总能耗也会随之降低,因二者并非简单的线性关系,数据中心PUE反而会增大。“双碳”的最终目的是实现节能减排,而不是唯PUE论。
真相6:双管齐下,“降PUE+减功耗“组合拳实现最低能耗
IT设备是数据中心运行过程中最大的用电来源,因此,数据中心想要更进一步节能减排,减少IT设备功耗是绕不开的一环。其中,存储的功耗在数据中心占比已超过30%,正在成为IT设备中功耗增长最快的设施。运营商数据中心想要实现绿色节能目标,更加需要:
1、从关注PUE降低走向关注存储功耗降低
数据中心存储1PB数据的年耗电量可达到30万千瓦时,折合碳排放为235.5吨。全球数据量在2025年将达到180ZB(约为1.8亿PB),是2020年的3倍;为了保存这些数据,存储耗电量将大幅增长。到2030年,全球数据中心存储碳排放量将轻松超过2019年全球碳排放量。因此,运营商数据中心要实现“双碳”,除了降低PUE之外,更要关注如何降低存储设备功耗。
2、从关注存储最大功耗走向关注能效指标
运营商在进行存储采购时,通常将设备最大功耗作为是否绿色节能的考核指标,但最大功耗是在设备满负载运行时产生的,并非实际使用过程中的常态,无法真实反映存储能效。全球网络存储工业协会SNIA(Storage Networking Industry Association)发布的存储能效测量规范,将容量/W、IOPS/W、带宽/W作为能效指标,能真实反映设备在不同IO模型下的性能和功耗。该规范在2019年被ISO/IEC采纳为国际标准,欧洲电信标准化协会ETSI、中国标准化研究院在2024年发布的存储能效标准中也将沿用SNIA的能效指标。
关注能效指标,有利于存储行业节能技术健康发展,运营商通过选择高能效的存储设备,可以实现相同容量、性能需求下每bit数据能耗最优,从而降低数据中心整体供电负担和减少碳排放。
谎言7:数据是核心资产,网络安全是运营商数据的护城河
当前,运营商基于防火墙、入侵检测系统等一系列网络安全产品,构建了感知预警、全面检测、应急处置等一体化的网络安全综合防御体系。防范网络的攻击、侵入、破坏和非法使用以及意外事故,使网络处于稳定可靠运行的状态,保障网络数据的完整性、保密性、以及可用性,从而守护数据安全。
然而,随着AI技术的迭代飞跃,黑客技术、攻击手法不断提升,电信行业网络安全事件频发。例如:2019年俄罗斯电信公司Beeline被黑,870万客户数据泄露,并将其在网上出售;2020年泰国最大移动运营商AIS云泄露83亿条互联网记录,数据被用于绘制用户网络活动图。运营商强大的网络防御体系在新形式的攻击下并不能确保数据万无一失。
真相7:网络百密必有一疏,存储是守护数据安全的最后防线
随着AI、5G和物联网等新兴技术的崛起,ToB业务蓬勃发展。由于网络暴露节点多,且需要传送海量数据,网络信息安全的边界正在弱化,加上数据“投毒”日益猖獗,网络层无法做到100%感知拦截。
从诺斯罗普·格鲁曼纵深防御模型来看,病毒发起攻击首先从网络开始,当它冲破整个网络的封锁,也就是打破整个网络安全界限以后,就会进入整个主机对应用的权限发起攻击。一旦获取到权限以后,目标就是最终的核心资产,即数据。由于勒索病毒善于伪装、通过漏洞、钓鱼、内鬼等方式入侵,潜伏周期长。即使网络层可拦截99%的勒索病毒,也会存在1%的攻击流入存储层,数据就会存在安全风险。
诺斯罗普·格鲁曼纵深防御模型
近几年来,存储的数据安全潜力不断被发掘,如保护数据机密性的落盘加密方案,以及保护数据可用性和完整性的勒索检测和恢复技术、WORM、安全快照、灾备、归档等。落盘加密可以解决存储介质被盗取后数据泄露的问题,防勒索方案则根据数据统计特征(如熵值变化、重删压缩率)的异常变化来判断数据是否正在被大批加密。相对网络和主机侧的安全方案,存储系统在保护AT REST(静态)状态的数据时拥有独到优势。
从数据产生,数据传输,数据存储,数据备份,到数据销毁,数据安全伴随着数据的全生命周期。存储是数据的最终归宿,我们只有从归宿出发,协同网、存、算建立数据在哪里,安全辐射在哪里的成体系、全系统的数据安全方案,才能解决数据安全真正的痛点。
综上,存储作为数据的最终载体,是守护数据安全的最后一道防线。通过存储硬件加软件能力建立系统不可突破、数据不可改变、业务可恢复的数据保护能力,可确保数据“一直处于可用状态”,避免发生数据安全问题时给企业带来经济、声誉、司法、人员变动等多方面影响。