如今,从日常视频通话到工业互联网数据传输,从家庭宽带使用到政务服务在线办理,人们的生产生活已离不开稳定的网络支撑。随着 5G-A 技术的广泛应用,网络设备数量激增、业务场景不断丰富,网络故障的排查与处理难度也大幅提升。
过去,跨域、跨厂商的疑难故障,传统运维往往需要工程师在多套独立系统中手动检索、比对海量日志与文档,耗时费力。如今,基于一套高质量的行业“语料教材”,智能运维系统能够快速理解问题、关联知识并给出精准分析,效率显著提升。
这背后,是浙江移动联合亚信等产业链合作伙伴,发挥中国移动创新研究院的研发优势,率先扛起语料建设创新大旗,依托中国移动“1+3+N”协同创新基地浙江节点网络智能化实验室,以“标准先行、平台支撑、数据赋能” 的系统化思路,打造通信网络运维语料规范与高质量数据集,为行业智能化转型树立了可复制、可推广的标杆。
行业痛点:四大难题锁住智能运维脚步
在千行百业加速数字化转型的今天,中国移动5G-A 技术规模落地,稳定高效的网络已成为社会运行的 “数字血脉”。传统依赖人工经验的网络运维模式,早已难以应对日益复杂的网络结构和海量业务需求,网络运维智能化成为释放数字潜力、推动产业升级的关键。
在浙江移动启动网络运维领域语料创新实践前,通信行业的语料建设正遭遇语料共享不足、建设成本高等四大核心难题,严重制约着运维智能化的进程。
一是语料资源“孤岛化”,不同地区、不同系统、不同厂商的语料数据各自为战,像一个个分散的 "信息孤岛",无法实现共享复用,难以形成规模效应;二是数据建设成本高,高质量语料数据集需要投入大量人力物力进行标注和梳理,让不少企业望而却步;三是语料标准“碎片化”,语料建设标准不统一,数据格式、标注方法不同,就像“方言不通”,整合协同效率低下;四是语料质量参差不齐,专业术语混乱、表述模糊,导致AI模型训练效率低、识别准确率不足,很多智能运维工具难以真正落地。
创新实践:标准、平台场景三维发力,构建数据驱动的运维新生态
面对行业 “卡脖子”难题,浙江移动从三个维度协同发力,积极推动网络运维智能化。
一是立标领航,制定行业首个系统性规范。浙江移动联合产业链伙伴,经过反复打磨优化,制定出《通信行业网络运维领域语料规范》——这是业内首个覆盖语料全生命周期的系统性标准。该规范对语料的数据采集、文档处理、标注方法、存储安全、隐私保护、版本管理等各个环节都作出了明确规定。无论是运维手册、产品文档还是故障记录,所有数据都有了统一“标尺”。这一规范彻底改变了此前各说各话的数据乱象,让不同地区、不同厂商的语料资源能够顺畅共享。
二是技术赋能,打造一站式数据使能平台。浙江移动自主研发了网络运维语料数据使能平台,提供从收集、清洗、标注到管理的一站式服务,支持问答对、文档、提示词等多种类型语料集的建设,大幅降低语料处理的人工成本。
以标注工作为例,通过自动标注+人工校对的模式,原本需10人天完成的任务,如今仅需2人天即可高效完成,效率提升达80%。同时,平台配备网络运维领域特色算子、数据脱敏、文本切片等功能,能有效处理各类专业数据,保障数据安全与质量,让语料处理更高效、更可靠。

浙江移动自主研发了网络运维语料数据使能平台,大幅降低语料处理的人工成本,内容涵盖 14个专业类型,包括 2,230个知识文档、13,253张图片 及 229,640条QA对
三是场景赋能,沉淀高质量数据集。浙江移动基于统一规范和平台能力,在核心网运维、家庭业务、网络安全等 30 多个关键领域,构建了高质量数据集,覆盖故障识别、参数查询、根因定位等核心运维场景。
在核心网运维场景中,平台沉淀 15000 + 条 4/5G 核心网信令数据,经专家标注整理形成优质训练集,通过微调训练出“信令大模型”。该模型构建的信令分析智能体接入投诉系统后,将 4/5G 上网业务投诉的码流分析时长从 1 小时压缩至 10 分钟内,分析准确率超 85%,投诉工单处理效率提升15% 以上,更快响应和解决用户投诉的问题。

家宽装维作业智能体帮助实现基于故障场景的智能诊断、解决方案生成,并实现落单自动诊断、处理方案智能推荐、部分远程操作自动执行、工单报结智能校验
重塑格局:节省成本超千万,引领通信运维智能化转型
浙江移动的实践不仅在语料规范、多模态数据处理和智能运维支撑三方面实现关键突破,更构建了“数据驱动—模型迭代—业务赋能—数据优化”的闭环生态,相关案例已入选中国信通院《人工智能高质量数据集建设指南》,成为行业认可的标杆实践。
截至目前,浙江移动已构建涵盖30 +场景的高质量数据集,支撑知识问答、故障处理、配置变更等多个智能体落地应用,累计为企业节省运维成本超千万元。同时,智能运维能力的提升让网络故障处理更快速、服务更稳定,间接惠及数千万用户,为数字经济高质量发展提供了坚实保障。
面向未来,浙江移动将持续紧跟 5G-A、算力网络等技术发展趋势,进一步拓展语料覆盖领域,优化数据平台能力。计划联合行业伙伴成立AI数据联盟,推动语料标准共建、资源共享与生态共赢,让高质量数据真正成为数字经济的核心驱动力。







































