本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘要:随着硬件及技术的发展,深度学习技术得到广泛的研究及应用,而数据作为驱动深度学习发展的重要输入,变得越来越重要。但是针对一些特殊场景,存在数据少、隐私风险等问题。针对上述问题,结合任意物体分割技术和图像修复技术,消除图像中隐私信息,生成不包含隐私数据的新图像;或结合生成模型,在去除指定目标同时生成包含其他正样本的图像;亦或者保留指定正样本,更换背景,生成不同场景数据。实验结果表明该种数据生成的有效性。
关键词:图像分割;图像修复;数据生成
doi:10.12045/j.issn.1007-3043.2023.07.009
概述
随着深度学习及大模型技术的发展,数据变得愈发重要。但特殊场景的数据存在数据量少、收集困难等问题,此外在已收集的数据中往往包含车牌、人脸等隐私数据以及一些其他的敏感数据。在以往的研究中,对于小样本任务的处理,往往采用迁移学习进行微调参数学习;对于敏感及隐私数据源,往往在数据上进行马赛克处理,遮挡敏感数据。
本文提出一种基于图像分割和图像修复技术的数据生成流程结构。该方法在用户输入的指导下,基于最新的任意物体分割模型自动选取合适的目标图像区域,接着采用前沿的图像填充技术,将选中的目标区域结合周围像素生成目标图像,进而生成一组新的数字图像。同时,该结构还可以结合图像生成大模型,基于现有图像,在指定区域生成新的目标样本或者保留现有目标,更换背景生成新的场景图像。