本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘要:机器学习广泛应用于NLP、数据挖掘、语音识别等领域。以国家统计局公示的城乡人口及性别差异数据为数据集,分析中国近70年的人口城镇化趋势、男女人口数量及比例差异、人口增长率变化,结合二次指数平滑法,建立时间序列人口预测数学模型,为预测模型构建数据迭代器,并给出2022年全国人口总量的预测值。研究结果验证了建立的模型在预测人口总数方面的合理性。
关键词:机器学习;时间序列预测;二次指数平滑法
doi:10.12045/j.issn.1007-3043.2023.02.011
前言
党的十八大以来,以人为本的新型城镇化进程不断推进,中国根据自身国情探索出了一条具有中国特色的城镇化发展道路。2013年户籍人口城镇化率只有35.93%,2021年则提高到46.7%,常住人口城镇化率更是达到64.72%。城镇化是国家和地区现代化的重要标志,人口性别结构的均衡发展则是人口城镇化协调发展的重要保障。
二次指数平滑法在指数平滑的基础之上,扩展了对以时间为单一变量序列趋势的支持。结合中国近70年的城乡人口数据,本文分析了中国近70年城镇化人口特征、城镇化过程中男女人口数量及比例差异、人口增长变化等情况,对一次指数平滑值再做一次指数平滑操作,建立人口预测数学模型,给出2022年中国人口总数的预测值。该预测值是基于近70年的历史城镇人口数据的加权平均,各参数值计算过程简单,总人口预测结果稳定,模型适应性较强。