1 U-vMOS重新定义视频体验评估标准
视频已成为网络上的最主要流量,视频业务体验已成为衡量网络服务质量的关键指标。伴随着视频分辨率的不断提升(从720P/1080P逐渐过度至4K/8K),视频业务对网络的要求也越来越高。如何评价当前网络下视频业务的体验,对用户和运营商来说意义越来越重大。
IP承载网是一个“尽力而为”的网络,网络视频业务占用带宽资源较多、实时性要求较高,并且对分组丢失、时延、抖动等网络特性非常敏感,尤其是时变的网络特性严重影响网络视频业务的质量。通过对网络视频质量的监控和反馈,可以调节编解码器或信道的参数,改善传输视频的服务质量。因此,需要实时准确地对网络视频服务质量进行监控,获得反映用户感受的视频体验质量。
早在2009年ITU-T就启动了针对视频业务的vMOS标准研究项目,并于2012年参考语音MOS指标体系发布了第一个基于视频体验的VMoS指标,用于监控视频经过网络传输后的质量损失,关注点在于视频QoE的检测和问题定位。这套指标完全参考了语音MOS的定义,先定义影响因素Compression、packet-loss、rebuffering,自下而上地计算vMOS。出发点是为了发现问题,用于视频质量监控,只站在技术视角看问题,没有考虑消费者对视频体验优劣的评价是跨越视频业务的全流程,也没有站在最终消费者体验的角度去横向比较不同的分辨率带给用户的不同体验。因此也无法完整的指导运营商网络的设计和优化。
华为认为在原有vMOS的基础上,需要根据以用户体验为中心的评价体系标准,用统一的衡量标准,来评价不同网络,不同屏幕,不同场景应用下的视频体验的好坏。基于以上出发点,华为视频研究团队结合人体工程学实验,样本调研和深入技术研究,提炼出适配全场景的视频体验TOP3影响因子,即视频质量(sQaultiy),互动体验(sInteraction)和观看体验(sView)。华为基于三大核心思想,设计了视频体验衡量体系评价标准U-vMOS,使TOP3视频体验影响因子得以量化,使得视频体验标准体系实现可采集、可评估、可演进。
影响视频质量,操作体验和播放体验三个模块的主要因素如图2所示U-vMOS的评价模型主要分为三个部分,即视频质量(sQuality),操作体验(sInteraction)和播放体验(sView),拟合出如下公式。
图1 U-vMOS建模方法
图2 sQuality的影响因子
图3 sInteraction的影响因子
图4 sView 的影响因子
1 基于U-vMOS的固定宽带网络评估的流程
对当前固定宽带网络进行基于U-vMOS的网络评估,需要达到如下几个目的:
- 体现单个典型用户的U-vMOS指标
- 体现整网的U-vMOS指标
- 识别当前网络承载视频体验与目标的差距及根因
- 基于根因制定网络优化及演进方案
基于以上目的,U-vMOS的网络评估的流程可以分为如下3个步骤:U-vMOS目标设定、差距和根因分析、优化方案实施
1.1U-vMOS目标设定
基于U-vMOS评估标准,视频的原始质量是U-vMOS的基准,整体的U-vMOS是在叠加操作体验和播放体验之后得出的。相同分辨率的视频的基准体验值在不同的帧率、视频编码方式和码率等条件下所能达到的U-vMOS基准不同。因此测量整体U-vMOS前需对网络视频的基准体验进行测量。如下为100英寸屏幕,不同分辨率下所能达到的基准质量的范围:
图5 100英寸屏幕不同分辨率视频的U-vMOS极限
1.1.1评估指标的定义
基于HTTP的视频点播业务是目前视频中占比最高的业务,它对网络质量敏感,定位问题困难。本文的评估主要针对基于HTTP的点播业务。基于U-vMOS的评估体系指标采集需要考虑到体验、业务及网络三个层次。
l体验KQI指标:从用户视角出发,对用户感知进行分解和量化。体验KQI指标参考U-vMOS关键要素,如视频质量、操作体验、播放体验。
l业务KPI指标:以运维技术人员视角,考虑业务的交互流程,用于分析影响用户感知的业务流程因素,例如DNS解析时间,CDN调度时间,视频分片资源分布等。
l网络KPI指标:直接反映网络管道运行的关键性能指标,如带宽、RTT、丢包率等。
1.1.2测试样本空间的确定
测量样本的选择决定了测量结果能否完整全面地反映被测网络的整体体验情况。样本包含三个维度的要求。
- 云样本:即选取哪些视频内容作为被测对象。云样本的选取要考虑覆盖不同的视频提供商的TOP热点节目的不同清晰度视频源。
- 管(网络)样本:即选择何种网络场景下的用户进行测试。管(网络)样本的选择需要考虑用户接入类型、用户套餐、不同区域、不同的网络层次、不同网络负载、不同线路质量(如:与基站距离的远近、光纤接入/铜线接入等)等因素。
- 测量时间段:不同的时间段,网络负载不同,测试时间段需要覆盖网络的忙时和闲时。忙时、闲时可由用户数或者流量大小来决定。宽带发展联盟认为通用场景下19:00~23:00为网络忙时,但不同运营商的用户行为可能不同,精确的忙时、闲时定义建议提前对运营商网络进行用户数及流量的评估,从而准确判断忙时、闲时时间段。
1.1.3U-vMOS评估指标的测量
U-vMOS的测量手段,主要有如下三类:
- 视频播放器集成U-vMOS算法引擎
在机顶盒、PC、手机/PAD等终端上集成华为U-vMOS算法引擎,通过视频播放器获取加载时长、卡顿、花屏等体验参数,调用U-vMOS引擎实时计算出结果并上报服务器。
- 网络设备打点分析
中间网络设备可以基于播放器的关键行为特征针,对每用户的视频交互流程进行分析打点,判断加载时长、频道切换时长等指标进行测量。同时还能够基于CDN与终端的实时数据传输速率和传输的数据量判断卡顿指标。
- 专用的U-vMOS测试终端
提供一种基于X86/Android通用硬件盒子,集成各种视频的客户端播放器,同时集成U-vMOS算法引擎,有选择性地抽样部署在网络的不同位置(基站、接入机房或者部分用户家中),对视频体验进行例行监控。
测量手段
|
优势
|
劣势
|
典型场景
|
视频播放器集成U-vMOS算法引擎
|
测量结果精确,覆盖范围全,实时获取结果。
|
播放器客户端需要升级
|
|
网络设备打点分析
|
两端无感知,不需要客户主动发起测试。
|
测量精度较差,部分指标无法测量,对于HTTPS加密传输的视频实施难度较大。
|
运营商实时监控网络中的视频体验质量
|
专用的U-vMOS测试终端
|
测试结果精确,实时获取结果。
|
终端用户抽样,样本数量有限。
|
一次性测试网络的视频体验
|
表1 测量手段比较
1.2差距与根因识别
差距与根因识别可以分成结果可视化、U-vMOS差距分析、根因分析等3个环节,对被测网络的视频业务体验质量做出综合评价,并分析体验的差距及影响体验的瓶颈根因。
1.2.1结果可视化
体验数据的展现可以分为整网统合指标,用户类指标,区域地图等维度来展现。
- 整网综合指标用于体现运营商对视频的支持情况,便于不同运营商之间对比,体现运营商网络的整体竞争力。
- 用户类指标是展现的是运营商网络内的特定一类用户的U-vMOS,便于运营商内部对不同网络方案或者套餐对视频的满足度进行比较评估。
- 区域地图通过网络拓朴与U-vMOS结合,可以清晰展现网络不同位置下的U-vMOS分布情况,便于运营商内部对不同区域或者层次的网络对视频的满足度的展示。
这些指标也可根据统计和分析需要,也可按时间段划分测试数据记录,衍生出全时段指数、忙时指数和闲时指数。
1.2.2U-vMOS差距分析
影响用户体验的瓶颈分析和问题诊断过程,应按以下原则顺序进行:
图6 U-vMOS差距分析流程
a)确定分析范围:制定U-vMOS 阈值,筛选出U-vMOS值低于规定阈值的测试数据记录进行逐条分析(如规定U-vMOS<3.5的测试数据记录均纳入分析范围)。
b)云侧瓶颈分析:分析测试数据记录中的业务KPI,判断是否存在服务器响应速度瓶颈、服务器负载能力瓶颈或服务器出口限速瓶颈。
c)网络瓶颈分析:分析测试数据记录中的网络KPI,与网络KPI要求基线进行对比,判断影响体验的具体维度。
1.3.3根因分析
基于网络KPI瓶颈可以对具体网络进行详细评估,以确定造成网络KPI差距(带宽、时延、丢包)的具体组网原因。如下为可能的根因示例:
图7 可能的根因示例
1.4优化方案实施
基于视频业务发展的不同时期,可以采用不同的优化方案
视频业务
阶段
|
业务导入阶段
|
中等业务规模阶段
|
大业务规模阶段
|
All业务阶段
|
业务挑战
|
高流量——单用户视频高码率,保证高的U-vMOS需要为每用户提供高通量
|
高并发——重点区域用户出现高并发,导致局部网络大流量、高负载
|
高突发——不同区域/不同时段的瞬间并发率差异极大
|
高感知——整视频业务质量不能实时感知,网络质量、容量、资源不平衡的问题不能实时发现
|
网络痛点
|
低带宽/弱覆盖&高时延/高丢包导致vMOS低
|
网络层层收敛,容易出现拥塞,TCP通量下降,导致vMOS下降
|
CDN和网络资源静态分配,无法动态调控,导致高业务突发的区域vMOS下降
|
|
优化方案
|
接入网优化:铜改光/Vectoring/G.fast,或者部署HTR
|
l OLT分光比降低,< 1:32
l OLT上行2*10GE
l BNG下移,简化OLT到BNG之间的二层汇聚网络
l 分布式CDN/CDN下沉,降低城域/骨干网扩容压力
|
IPTV平台和网络进行协同,防止网络过载,保证业务选择最优CDN路径
|
可视化运维:KQI & KPI感知、E2E视频可视化运维
|