本文版权为《邮电设计技术》所有,如需转载请联系《邮电设计技术》编辑部
摘要:通信设计行业现存百万级别的图片、PDF等格式的工程图纸,且数量与日俱增,这些图纸无法直接用于设计的数字化推进。基于目标检测、语义分割等技术,针对机房、铁塔、天面图纸等类别的存量工程图纸,分别研发出相应的图纸识别AI算法并形成产品,可生成图纸中设备类别、坐标、尺寸等矢量化信息;同时研发了基于矢量化信息复原生成工程 CAD 图纸的算法,打通了从图纸识别到图纸复原的全流程,实现海量存量图纸的数字化。
关键词:图纸识别;目标检测;深度学习;数字化
doi:10.12045/j.issn.1007-3043.2023.07.006
概述
在通信设计行业工程图纸领域,各种CAD软件被广泛应用。CAD技术给工程设计带来了便利,提升了图纸存储、信息检索的效率。但过去几十年中,各大中型设计院、企业等所保存的海量设计图纸,仍以纸质版或图片的形式进行存储和使用,它们可将空间范围内设备的分布情况进行可视化展示。在实际的生产、资料存储、检索与编辑过程中,存在以下几个弊端。
a)难修改。由于图片无法直接编辑,在工程建设的过程中,每次修改都需要专业的绘图人员对整张图纸进行重绘制,耗费大量的时间以及人力资源。
b)难统一。在全国不同地域与设计院单位的工程图纸中,由于工程师的绘图标准、偏好不统一,即使同一设备在不同图纸中的可视化形式也可能有所差异,影响工程建设。
c)难管理。平面图纸只是可视化了设备所在的空间位置分布,难以统计和获取某一空间范围内设备的具体数量、设备的分布情况以及可利用的空间资源等信息,对于工程重规划以及继续建设等项目带来了很大的难题。
随着信息扫描技术的发展和图纸管理系统的普及,大多数纸质图纸都经仪器扫描转化为PDF、PNG等电子格式进行存档和管理。但这种格式无法在 CAD 中编辑更改,一旦出现设备增删或变更的情况,仍只能通过重绘来更新,这无疑给图纸再设计和运维工作带来巨大的不便。推进图纸的自动识别与数字化迫在眉睫。
目前对图纸的识别和数字化研究成果相对较少,处理对象大多基于扫描的高质量图纸,计算平台依赖个人电脑。传统方法以矢量化方法为代表,即利用扫描仪形成点阵图像,经过预处理和矢量化的操作,用线段描述图形符号。这样的方法具有明显的缺陷,它对噪声十分敏感,容易畸变,后续往往需要细化算法的辅助才能使用。之后提出的图像轮廓跟踪法在工程图纸矢量化中引入了平均链码和线条的概述,在实现直线或微弯曲线的整条提取、跟踪的同时,图文的磁量化速度和质量有较大的提高,然而尽管它可以提高鲁棒性,但其识别层次较低,无法精确区分各组件的语义。基于对象图例及其拓扑关系进行图纸识别的方法在一定程度上可以改进这个问题,它针对对象图例的几何属性,通过对多类对象图例分类,提取对象的环形分割特征识别子类对象图例,基于连通域标记方法实现对象图例拓扑关系的识别。非传统的、基于学习的方法直到最近才开始渗透到文献中,而且还远远没有解决传统符号识别方法的问题,因为它们大多只针对特定的符号识别应用。例如只解决图纸主体部分的识别或只解决表格的识别等,没有对整体图纸进行相关系统的设计。徐剑,张皓等人在特征提取过程采用 VGG16 网络,利用深度学习方法对电网图元进行识别,可识别的类别包含 9 类电网图元。然而对于通信行业工程图纸中成百上千种形状各异的设备而言,这种方法显然无法满足需求。
本文提出一套基于深度学习的通信设计行业工程图纸智能识别与重构系统,可以系统性地识别整张图纸中的设备元素、标尺和文字标注等信息,形成矢量化的结构化数据结果文件,该结果文件可以 JSON的形式保存。同时考虑到图纸识别算法中不可避免出现的误识别、漏识别等情况,开发了一套图纸识别交互工具,用户可在该交互工具上对错误识别的部分进行定义赋值,实现修改及补充,生成完全复原的矢量化结果数据,该数据可以与数字化设计平台对接,实现图纸的数字化分析、统计与管理,实时统计指定图纸中设备的类别分布与数量、剩余可利用资源等信息。此外,针对大量的有线/无线传输专业的通信设计图纸中的数百种设备类别进行了归类与标准化,建立了一整套图纸模型库,研发形成一套CAD图纸生成程序,对于图纸识别的矢量结果,通过调用该图纸模型库,可以生成标准化的图纸,快速还原工程图纸。对于设备管理、工程重规划以及继续建设等项目提供了重要的参考信息,解决了难管理的问题。