本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘 要:根因分析是企业数字化运营关注的重点领域,当关键性能指标波动异常时,快速、准确、自动地定位到根本原因,有针对地调整运营策略,对企业实现业务目标非常关键。基于此,分别针对量值KPI和率值KPI设计根因评价指标,提出单维和多维根因定位方法,同时提供根因层级的定位方案,自动化输出影响关键KPI波动的根因结论。
关键词:根因定位;根因分析;量值KPI;率值KPI;多维根因
doi:10.12045/j.issn.1007-3043.2025.11.007
引言
在数字化转型的趋势下,经营决策高度依赖数据分析,企业对大量的关键指标进行监控、异常分析,并挖掘波动原因,以便及时调整营销策略。现有的经营报表大都采用可视化形式展示关键指标的同比、环比等变化情况,当发现波动异常时,再由数据挖掘人员进行下钻分析。当数据集具有较多维度时,人工定位的挑战将增加:由于缺乏体系的科学定位方法,更依赖分析经验,不仅耗时增加,还容易遗漏掉某些关键因素组合,可能导致决策误判。随着企业的业务规模不断扩大、场景不断增多,更急切地需要采用体系的多维根因定位方法来实现海量数据的根因挖掘。
目前,根因定位的方法有启发式搜索、机器学习、深度学习等。其中,启发式方法首先需要定义自己要搜索的根因,并定义一个目标函数以评估根因,然后在整个搜索范围中找到使目标函数最大化的因素组合作为根因。主流的启发式算法有Adtributor、iDice、HotSpot、Squeeze等。其中,Adtributor 方法通过逐一计算各维度的解释度和Surprise值,选出Surprise 值最高的几个维度,完成根因定位,但是该方法没有考虑多维根因的情况。iDice方法提出根因评估指标Isolation Power,需对大量的节点进行异常检测,在维度和取值较多时,从上至下的搜索以及自下而上的聚合的复杂度极大。HotSpot方法提出基于Ripple Effect 的根因判断方法,但HotSpot算法假设所有的根因在一个cuboid(即维度完全相同的属性组合的集合)内,只适用于可加性的量值指标,不适用于率值指标。PASER模型在此基础上进行改进,适合加性多维异常根因定位。Squeeze方法提出广义的涟漪反应(Ripple Effect)和潜在得分(Potential Score),使其也适用于率值指标,但要求满足根因节点与其所有叶子节点之间符合涟漪反应(RippleEffect)这一条件,而实际业务经营数据较难满足这一假设。并且,现有技术方法大都需要分析人员设定某些阈值,而设置阈值的过程取决于相关人员的主观意识和经验,这些都直接影响根因定位结果。针对上述情况,本文提出一种同时适用于量值指标和率值指标、单维和多维数据、计算效率高、更符合企业经营数据特征的指标波动根因自动化定位方法,其创新点如下。
a)提出针对量值关键性能指标(KPI)和率值KPI的根因评价指标设计方法,弥补当前相关技术主要针对量值KPI的不足。
b)提出单维根因和多维根因定位方法,通过手肘法确定重要根因数量,避免了主观设置阈值的误差。
c)提出根因层级的定位方法,自动化输出影响关键KPI波动的根因结论。









































