C114通信网  |  通信人家园

专题
2021/12/21 16:44

运营商大数据轨迹聚类优化算法及其在疫情防控中的应用

邮电设计技术  成晨,程新洲,晁昆,张涛,曹丽娟,徐乐西 等

本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部

摘要:由于新冠病毒存在14天以上的潜伏期且在潜伏期具有传染性,密切接触者的排查至关重要,而运营商大数据以其独特的优势在寻找隐性接触中发挥着重要作用。在传统k-means聚类算法的基础上,优化损失函数并提出基于多目标函数的簇头选择算法,形成多目标轨迹聚类优化算法。在此基础上,构建基于运营商大数据的新冠肺炎疫情防控的密切接触者排查方法体系,将该算法用于隐性密切接触者的排查。

关键词:多目标优化;鸟群觅食算法;数据挖掘;k-means;轨迹聚类

doi:10.12045/j.issn.1007-3043.2021.11.005

概述

2019年末,首例新型冠状病毒肺炎在湖北省武汉市出现,并随着2020年春运期间的大规模人群迁徙迅速传播。经过艰苦卓绝的努力,我国疫情防控阻击战取得重大战略成果,目前已进入常态化的防疫阶段。

针对抗疫阻击战,总书记多次作出重要批示指示,强调要运用大数据等手段,加强疫情溯源和监测。2020年,工业和信息化部多次召开疫情防控大数据专家会商会,传达国务院应对新型冠状病毒感染的肺炎疫情联防联控机制会议精神,研究部署大数据支撑服务疫情防控相关工作。

在疫情防控中,与感染者直接居住生活在一起、共同乘坐交通工具、乘电梯以及通过其他方式直接接触的人员被称为密切接触者。与显性密切接触者(共同居住生活或工作的人)相比,隐性密切接触者(无法通过现有实名制数据直接追溯到的接触者)难以追溯和排查却依然存在感染风险。例如2020年1月19日,重庆市一名公交车乘客因为与一名患者相隔16秒登上同辆公交车,而被确诊为新冠肺炎患者;2020年1月22日,湖南某城市一个感染者乘坐公交车同时传染了13个人。

随着疫情防控工作逐渐常态化,对隐性密切接触者排查的精准化需求逐渐提升。运用传统的排查方法难以定位隐性接触者,而运营商大数据以其独特的优势在寻找隐性接触者时可发挥重要作用。运营商是天然的大数据集中地,拥有百万级的基站资源、亿级出账用户数、PB级日均数据生成及采集量,运营商大数据具备用户规模巨大、覆盖空间广、时间连续性强的优势,可以全面立体地刻画用户特征,为找到隐性接触者提供一定支撑。寻找乘坐共同的公共交通工具的隐性接触者,可以抽象为轨迹聚类问题,现有轨迹聚类算法的核心思想是采用欧式距离作为损失函数,基于k-means或基于密度的聚类算法进行轨迹聚类,而没有充分地考虑各类噪声数据对聚类结果的影响。另一方面,现有聚类方法多侧重于数据清洗后的聚类算法实施过程,而没有针对运营商OSS域大数据从预处理到模型训练的完整过程。

点击查看全文(PDF)>

给作者点赞
0 VS 0
写得不太好

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

热门文章
    最新视频
    为您推荐

      C114简介 | 联系我们 | 网站地图 | 手机版

      Copyright©1999-2025 c114 All Rights Reserved | 沪ICP备12002291号

      C114 通信网 版权所有 举报电话:021-54451141