本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘 要:在仓储智能化进程中,仓储环境动态性与边缘设备算力限制影响货物识别。光照变化、货物遮挡堆叠及算力不足均制约识别准确性与效率,为此提出多模态特征融合动态自适应框架,构建RGB-D图像与激光点云跨模态特征对齐网络,融合空间几何与纹理特征,根据环境数据实时优化动态权重;设计通道剪枝与知识蒸馏协同的轻量级推理架构,将模型体积压缩至原来的30%。实验结果表明,多模态方案比单模态准确率提升8.2%,在遮挡场景下准确率达96.5%;轻量级模型准确率为98.1%,推理速度提升2.3倍。
关键词:仓储货物识别;多模态融合;轻量级模型;动态环境适应
doi:10.12045/j.issn.1007-3043.2025.06.001
引言
在全球经济快速发展的当下,仓储物流行业正处于智能化转型的关键时期。Statista统计数据显示,2024年全球仓储市场规模已高达3200亿美元。在这一庞大的市场体系中,货物识别的准确率对仓储运营成本有着至关重要的影响。研究表明,货物识别准确率每提升1%,便能为行业降低23亿美元的年损耗。然而,仓储环境的极端复杂性为货物识别带来了巨大挑战。从光照条件来看,仓储环境中的光照强度变化范围极大,在0~2000lux波动,这种剧烈的光照变化会严重影响基于视觉技术的货物识别效果;同时,货物的堆叠遮挡情况也十分常见,最高遮挡率可达70%,这使得传统的视觉识别方案难以准确获取货物的完整信息。此外,边缘设备作为仓储智能化的关键终端,其算力限制也成为制约货物识别技术发展的重要因素。仓储货物识别案例如图1所示。
在现有的货物识别技术中,单模态RGB模型,如广泛应用的YOLOv8,在遮挡场景下的准确率低于90%,无法满足工业级的高精度需求;激光点云方案虽然在几何结构信息获取上具有优势,但像PointNet++这类模型存在纹理信息缺失的问题,导致其对货物的识别不够全面。而在轻量化模型领域,CPNet等模型虽能将体积压缩40%,但精度损失却超过5%,难以平衡模型体积与精度之间的关系,同样无法适应工业场景的严格要求。
针对上述问题,本研究提出一种创新的动态多模态特征融合与边缘轻量化协同方案,通过多方面的技术创新,突破现有技术瓶颈。一方面,设计基于环境传感器数据的自适应权重机制,实现动态多模态特征对齐。这一机制打破了传统静态融合的局限,能够根据光照变化实时调整模态权重,从而在不同光照条件下都能有效融合多模态信息;另一方面,提出联合损失函数,实现剪枝—蒸馏协同优化。该方法将通道剪枝的结构化稀疏性与知识蒸馏的特征迁移相结合,在大幅压缩模型体积的同时,最大限度地保持模型的准确率。此外,为了更好地适配工业场景,本研究构建了包含异形货物、反光表面等特殊情况的增强数据集,使得模型在遮挡场景下的准确率达到96.5%,满足ISO 2382-27中的工业实时性标准(延迟<50ms)。本研究使分拣效率提升了27%,为《物流领域计算机视觉应用白皮书》提供了核心技术支撑,推动了仓储智能化技术的实际应用与发展。