收藏 分销(赏)

基于PDF图纸文件的智能审查技术路径研究.pdf

上传人:自信****多点 文档编号:2396023 上传时间:2024-05-29 格式:PDF 页数:6 大小:3.35MB
下载 相关 举报
基于PDF图纸文件的智能审查技术路径研究.pdf_第1页
第1页 / 共6页
基于PDF图纸文件的智能审查技术路径研究.pdf_第2页
第2页 / 共6页
基于PDF图纸文件的智能审查技术路径研究.pdf_第3页
第3页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第1期(总第232期)2024 年 2 月CHINA MUNICIPAL ENGINEERINGN o.1 (S e r i a l N o.2 3 2)F e d.2 0 2 4116基于 P D F图纸文件的智能审查技术路径研究张 晓 松1,杨 海 涛1,郦 振 中1,倪 奕1,李 一 帆2,王 剑11.上海市城市建设设计研究总院(集团)有限公司,上海 200125;2.上海品览数据科技有限公司,上海 200040摘要:以明挖隧道工程图纸为例,研究针对 PDF 格式图纸进行智能审查的技术路径。基于当前 CAD 文件的 AI 审图的技术基础,提出 2 种智能审查的技术路径,一为基于 PDF

2、转换为 CAD 图纸审查,二为直接基于 PDF 图纸审查。解析 PDF 图纸的各类图元信息特征,对 2 种技术路径进行可行性和有效性研究,最终选择后者作为实施路径,搭建明挖隧道智能审查平台,并进行技术验证。关键词:工程设计;图纸;CAD;PDF;智能审图中图分类号:TP391.72 文献标志码:A 文章编号:1004-4655(2024)01-0116-05收稿日期:2023-10-08第一作者简介:张晓松(1975),男,教授级高级工程师,本科,主要从事桥梁设计工作。DOI:10.3969/j.issn.1004-4655.2024.01.026在工程设计领域,BIM 审查与 CAD 审查已

3、经出现成熟完整的流程和应用供应商,例如 PKPM、万翼、广联达等,但针对市政工程领域 PDF 格式图纸的审查方案依旧缺失。本次研究面向 PDF 格式图纸的审查问题,以明挖隧道工程图纸为例,对智能审查技术路径进行探索和验证。1 研究背景在市政工程领域,出于对项目保密性、技术保护性的考虑,报审文件以 PDF 格式为主。如何应对 PDF 图纸的实现智能识别审查,是技术解决方法的关键。具体功能包括在线看图、人工审图、文本检索、规范一致性审查、底板跨中配筋一致性审查、暗埋段一致性审查、停车视距审查等 8 条涉及不同专业的审查规则。2 PDF 图纸特征2.1 文件来源PDF 格式的图纸主要有 2 种形式,

4、分别是具体的工程图纸和项目配套的计算书。图纸格式的来源分 2 类,一类由扫描获得,一类通过 CAD 或 Office导出。本次研究范围是通过 CAD 导出且具有图层信息的 PDF 图纸,或 Office 导出的 PDF 计算书。2.2 图纸特征针对 CAD 导出的 PDF 图纸,从文字信息、图像信息、以及标注信息 3 个方面具体说明文件特征,作为研究识别审核的技术手段的依据1。1)文字信息。工程设计图纸中包含大量文本信息对图像进行说明,识别文字是基础信息提取的重点审查内容。在 CAD 图纸中,有 2 种字体样式,TrueType 字体与 SHX 字体2。转化为 PDF 图纸后,TrueType

5、 字体被转换为可直接编辑的 text 文本3。但是,由于 PDF 格式图纸中的“文字”并不全是以文本形式存储的,SHX 字体在导出为 PDF 后,变成由线条拼凑的文字,见图 1、图 2。对于这类文本,需要先进行识别,才能用于后续的规则检查。图 1 TrueType 字体导出为 PDF 后仍为可编辑的 text 文本图 2 SHX 字体导出后为 PDF 后变成线条拼凑的文字1172024 年第 1 期张晓松,杨海涛,郦振中,倪奕,李一帆,王剑:基于 PDF 图纸文件的智能审查技术路径研究2)图像信息。在 CAD 图纸(DWG 格式)中,几何图形信息表达为完整的多段线条,导出 PDF后,原有的几何

6、图形信息失真。在 CAD 图纸中,虚线为一个线条整体,导出为 PDF 后整体性缺失,变成多个不连续的微小线段。具有一定宽度的线段会被转换为由三角形拼合的矩形,点和圆形则被转换为由三角形绕顶点旋转而成的多边形。综上所述,CAD 文件在导出转化的过程中,几何图形原有的信息整体性被破坏,出现破碎化与信息失真。几何图元的表现形式见表 14。表 1 2 种文件格式下几何图元的表现形式图元类型DWGPDF直线Linestart point+line+end signal圆Circlestart point+curve+end signal圆弧Arc,EllipseArc椭圆Ellipse多线段Polyli

7、nestart point+curve/line+end signal复杂曲线Spine3)标注信息。图纸中的标注信息是文字与图像的合并表达5,转化为 PDF 图纸以后,原本整体的标注信息被打散,根据上述图元特性,被转化为不整体线段与破碎的文字笔画线段组合,失去原有标注引线与文本信息的关联性。因此,要重现标注信息,关键在于对不同类型线段信息的组合与还原。2.3 Office 导出项目计算书特征项目的计算书内容涵盖大量的具体参数信息,是进行审查比对的重点。在计算书中,大部分的工程信息以图表的形式呈现,因而对表格内信息进行识别和归纳处理是计算书审查的重点内容。Office 导出的计算书(PDF 格

8、式)中的文字是可编辑的 text 文本。但是,表格的层级特征,导致信息并非直接一一对应,而是包含大量多对一或一对多的排列情况。所以,表格信息需要进行不同归并处理。由于表格的层级不同,需要对表内信息合并归纳,这是表格在图纸审查问题上的特殊之处。3 技术路径的设计基于 PDF 文件的审图系统,需要综合若干技术才能实现 AI 智能审图,主要包括 PDF 矢量化、OCR(Optical Character Recognition)识别、图形结构化、AI 审查等。介绍 2 种应对 PDF 图纸审查的技术解决手段:一是将 PDF 图纸转换为 CAD 格式接入既有的审查体系;二是直接面向 PDF 图纸进行解

9、析审查。3.1 既有 CAD 图纸的 AI 审图技术路径AI 审图的基础,首先是对 CAD 导出的 DWG图纸做图层解析,由于工程图纸在绘制过程中具有图层属性,绘制不同的对象和构件需建立独立图层,这为构件的识别和区分带来便利。进行图层筛选,选出需要识别的图层,对各个图层独立打印,生成单图层元素的 PNG 图片,基于 PNG 图面进行 CV(Computer Vision)识别,进行构件识别。依据构件的识别生成围合空间的判定识别,得到从2D 图纸转化的空间模型信息6。这套基础技术流程适用于明挖隧道项目的审查要求,审查中,对于不同对象和构件,例如钢筋、混凝土墙体的识别,可以有效进行待审查对象的识别

10、查找,见图 3。图元 CAD 图层图元 CAD 坐标其他解析信息图元推荐图层图元 PNG 坐标其他转换信息图纸 PNG 图片构件位置信息构件类别类别构件图层推荐逻辑构件图层逻置图元坐标转换构件合并推荐图层打印构件小图获取CNN 模型推理空间轮廓空间 BBOX空间名称借助构件等的空间分割后处理空间轮廓空间 BBOX空间名称基于空间和构建的审查土建连线搜索空间图像处理空间名称匹配借助图层、空间、构件尺寸等的构件分类后处理图 3 AI 审查技术流程1182024 年第 1 期张晓松,杨海涛,郦振中,倪奕,李一帆,王剑:基于 PDF 图纸文件的智能审查技术路径研究3.2 基于既有 CAD 审查的技术改

11、造方案尝试将 PDF 文件转换回 DWG 文件,若能还原导出前的文件图元信息,即可直接接入已有的审查系统。对 PDF 转换为 CAD 图纸的方式方法的进行调查研究,并分析其可行性。1)现有的 PDF 转换还原为 CAD 的技术手段主要有:(1)通过开源 pdf2dxf 对文件进行转换;(2)通过第三方 ODA 对文件进行转换。流程见图 4。根据审查规则整理相应的 PDF 图纸进行测试,得到关于图层、文本、图元还原情况的准确率,见表 2。从中可知,虽然将 PDF 转换为 CAD 文件后进行审查可以更好的利用现有审图体系,但是其图层、图元、文本还原准确率仍有一些缺漏,考虑直接基于PDF 图纸进行审

12、查的可能性。加载 PDFDXFCADJSONPNGOCR开源:第三方:华为云、百度云、阿里云文本图元坐标坐标返回识别文本匹配审查提取图元RealdwgPDF 转 DXF开源:pdf2dxf(Github)第三方:ODA(收费)图 4 PDF 转 CAD 智能审查流程表 2 PDF 转 CAD 转化效果表编号使用服务效果PDF 转DXFOCR图层还原准确率文本还原准确率图元还原误差1ODA华为云(表格)91.9%差0.25%2ODA华为云(文本)91.9%80%95%0.25%3开源pdf2dxf华为云(文本)低极大4ODA开源 OCR91.9%文本识出率约为50%,对于已识出文本,识别准确率在

13、30%75%0.25%2)转换中信息损失的主要原因在前文中已论述,由 PDF 转回的 CAD 文件,文字变成了线段与图形的组合,而原本有粗细变化的图元线条和填充图形,转换后变成三角形拼合的图样。造成由 PDF转回的 CAD 文件,接入既有 CAD 审查的技术,识别准确率下降,见图 5 图 7。图 5 PDF 转回后线形样式转换前转换前转换后转换后80080010181018800800转换为三角形拼合图图 6 PDF 转回后圆点图元样式转换前转换后转换为填充图形图 7 PDF 转回后文本样式3.3 直接基于 PDF 文件的智能审图考虑直接基于 PDF 做智能审图。从 PDF 格式的文档中提取图

14、层、几何图形、文本信息等。通过第三方 SDK(软件开发工具包)解析,直接得到满足审查流程 JSON 格式文件。基于 Google 开源的 Pdfium 库,读取 PDF 内的信息,并以 JSON文本形式保存,从而直接进行审查。具体流程见图 8。采用第三方开源 Java 库 PDFBox 解析 PDF文件。PDF 解析的结果保存为 CADJSON 格式,以便对接与已有的审查流程。CADJSON 转换为云设计模型,实现后续的在线浏览和编辑。解析过程中,可以直接对图层、TrueType 文本、几何图元、图片做处理,SHX 文本和表格需做特殊处理。从 JSON 文 件 生 成 OCR 识 别 所 需

15、的 图 片。OCR 识别产生的结果包括:文本信息和文本所在像素区域。基于像素区域,后续可以在矢量图纸中还原文字的坐标位置。1192024 年第 1 期加载 PDF遍历对象转换内存对象否否SHX 匹配是是是无匹配几何归到图签分组转成 SHX 文本生成 JSON保存文件图签分组是否为标注是否匹配到是否为图片是否为图片图 8 直接基于 PDF 的审图流程源 PDF 文件经过矢量化和 OCR 识别处理后的数据需整合优化,即把 OCR 识别后的文本信息与矢量数据进行匹配,建立文字与线条信息的联系。此步骤依赖多个空间矩阵变换。在矢量 JSON 文件中,图元所在的坐标系(矢量空间)见图 9。获得图纸在世界坐

16、标系的尺寸:长度(L)和宽度(W)。转换前转换后图 9 转换前、后图纸的坐标变换3.4 2 种技术路径对比基于 PDF 转换为 CAD 图纸审查,依靠现有技术,在转换的过程中信息缺失、损耗的比例高。此外,由于来回转换格式的步骤增加,进一步增加损耗,导致审查的准确率降低。直接基于 PDF 图纸审查,就调研情况来看,对 PDF 直接解析的技术相对成熟稳定。同时,直接审查的减少了整体流程,技术开发更加直接便捷。基于此,最终采用直接基于 PDF 图纸审查的技术路径。4 技术验证结果以明挖隧道工程图纸为例,重点考察文本审查、配筋一致性审查规则,对直接基于 PDF 图纸审查的技术路径做技术验证。4.1 文

17、本识别审查文本检索作为平台的基础功能,由 PDF 图纸直接解析转化为 JSON 格式后进行 OCR 识别,文本数据与坐标返回信息。由于需要跨图纸进行检索,完成图纸解析识别后,后端查询调用已存储的数据,返回图元的坐标信息,从而实现查询和文本定位的功能。目前,已经实现对所有图纸内容的检索和跳转功能。同时,为应对工程领域的特殊需求,也支持对特殊符号的识别审查,例如钢筋配筋符号 等,见图 10 图 11。审查图纸目录审查问题概览审查详情问题处在图纸中高亮图 10 文本检索审查结果平台页面显示源文件识别结果 文字识别结果 文字识别准确率图 11 文本检索的比对验证结果和准确率显示4.2 图表比对审查配筋

18、一致性作为图纸审查的重点,不仅需要识别图像与文本,而且还需要跨图纸、对照信息来实现审查工作一致性。这是智能审图最为复杂的规则。审查过程中,首先需要对图纸进行信息的提取,需要对图元,例如钢筋截面等要素进行准确的识别,并考虑标注信息的提取和匹配。例如,为识别桩基配筋数据,首先找到纵筋截面图元所在图层通过纵筋截面,锁定标注引线的线段根据距离测张晓松,杨海涛,郦振中,倪奕,李一帆,王剑:基于 PDF 图纸文件的智能审查技术路径研究1202024 年第 1 期算,推测出与标注引线相对应的配筋数据对所有截面配筋数据的遍历找出需要进行匹配的截面。另外,在对计算书进行识别的过程中,对表格进行识别和归纳信息的处

19、理,获得到计算书中的配筋要求。最终根据图纸和计算书的数据,得到匹配段配筋信息,完成审查,见图 12。目前已经支持多种不同类型图面表达形式的审核。高亮图纸中不匹配数据读取图纸与计算书信息,并进行匹配,对不匹配数据红色高亮。图 12 断面配筋一致性审查结果5 结语分析 2 种技术路线,探讨直接基于 PDF 图纸进行智能审查的可能性,并通过明挖隧道智能审查平台的搭建完成验证。目前,针对文本检索和规范一致性,已支持多张图纸和多个关键词的检索;针对配筋一致性,支持图纸的直接与间接标注,识别准确率在 90%以上。未来提升空间在于完善数据的多样性、丰富性,从而建立完善的识图数据模型,全方位的提高审查的准确率

20、。参考文献:1 张轩铭,彭科夫,张荷花.AI 审图技术在核电工业消防审查中的应用 J.土木建筑工程信息技术,2023,15(3):7-12.2 Autodesk Support.如何在 AutoCAD 中以 PDF 形式创建可选择和可搜索的文字 EB/OL.2023-09-08.https:/ Autodesk Support.将图形文件输出 PDF EB/OL.2023-09-08.https:/ Autodesk Support.EXPORY(命 令)EB/OL.2023-09-08.https:/ Autodesk Support.文字符号和特殊字符参考 EB/OL.2023-09-08

21、.https:/ 郭佳.基于图像的表格识别算法与自动录入系统 D.北京:北京邮电大学,2018.张晓松,杨海涛,郦振中,倪奕,李一帆,王剑:基于 PDF 图纸文件的智能审查技术路径研究对 2 种方案的运营成本做对比,其中,轴流风机和空气净化设备均以每天高峰期间开启 4 h 工作时间计算,电费单价参考同一城市已建运营隧道2022 年 7 月实际电费价格高峰小时 1.031 8 元/度来计算,结果见表 4。表 4 模运营成本对比项目集中高空排放系统方案空气净化设备系统方案隧道轴流风机365 d4 h110 kW4 台 1.031 8 元/度电=66.3 万元365 d4 h80 kW4 台 1.0

22、31 8 元/度电=48.2 万元空气净化设备(北+南)/(万元a-1)净化电费3.1基础清洗剂5.2基础维保3.2基础总费用11.5再生活性炭 160(第 5 年起)后续运营投资/(万元a-1)66.3前 4 a 为 59.7,第 5 年起为219.7(再生)4 结语结合国内某新建越江隧道工程实例,针对隧道空气净化问题,做 2 种方案比选:集中高空排放系统方案与空气净化设备系统方案,对比建设和运营成本。隧道空气净化设备系统方案的经济投入可控,初期整体建设投资显著低于传统集中高空排放方式,节省的 2 002 万元可供后续净化设备持续运营 17.2 a。采用空气净化设备系统方案,隧道洞内污染空气

23、,经过净化,回灌主线,在出洞口处直排。隧道两端无需再设高风塔和相应长风道,避免了传统隧道高风塔建设时困难多、维稳压力大、建设成本高等问题;避免了对周边环境和城市景观的破坏,改善行车环境和乘客健康,降低了隧道空间内污染源总量。该方案在提倡低碳韧性的社会大背景下,使隧道工程整体兼顾了社会效益。参考文献:1 张波文,唐晓龙,易红宏,等.改性活性炭吸附去除NO实验研究J.化工新型材料,2015,43(7):111-113,121.2 张豪杰,姚炜,刘洋,等.改性整体式活性炭净化 NOJ.环境工程学报,2012,6(10):3703-3707.(上接第 110 页)160ABSTRACTSbetween

24、 temporary piers,the poorer the stability of the upper chord.When arranging the second type of temporary pier,the main pier and temporary pier reach the most unfavorable reaction situation in two states:pushing to the maximum cantilever and pushing to position,and the temporary pier plays a crucial

25、role.Key words:temporary pier;arch bridge;top pushing construction;guide beam;stress;deflectionResearch on Intelligent Review Technology Path Based on PDF Drawing FilesZHANG Xiao-song1,YANG Hai-tao1,LI Zhen-zhong1,NI Yi1,LI Yi-fan2,WANG Jian1(1.Shanghai Urban Construction Design&Research Institute G

26、roup Co.,Ltd.,Shanghai 200125,China;2.Shanghai Pinlan Data Technology Co.,Ltd.,Shanghai 200040,China)Abstract:Taking the open cut tunnel engineering drawings as an example,it studies the technical path for intelligent review of PDF format drawings.Based on the technical foundation of AI drawing revi

27、ew for current CAD files,two intelligent review technology paths are proposed:one is based on PDF conversion to CAD drawing review,and the other is directly based on PDF drawing review.Analyze the various graphic information features of PDF drawings,conduct feasibility and effectiveness studies on t

28、wo technical paths,and ultimately choose the latter as the implementation path to build an intelligent review platform for open cut tunnels and conduct technical verification.Key words:engineering design;drawing;CAD;PDF;intelligent drawing reviewResearch on the Impact of Deep Excavation of Shield Tu

29、nnels on Adjacent Ultra-High Pressure Gas PipelinesREN Hui1,BI Jin-feng2,GUO Bao-he1,LI Yan1,PU Wan-li1(1.Zhuhai Rail Transit Co.,Ltd.,Zhuhai 519000,China;2.Shanghai Urban Construction Design&Research Institute Group Co.,Ltd.,Shanghai 200125,China)Abstract:Taking the excavation project of the starti

30、ng shaft and frame section of the Zhuhai Tunnel as the background,numerical simulation is used to study the influence of surface settlement caused by excavation on the internal forces of adjacent existing gas pipelines.Using the finite element method,the monitored gas pipeline settlement data is use

31、d as the boundary condition of the numerical model to calculate the internal force changes of the gas pipeline.Based on the numerical simulation results,select the parts of the pipeline with sudden changes in local internal forces and high internal forces for on-site monitoring.The simulation result

32、s indicate that the increase in internal forces of gas pipelines caused by geological subsidence is limited.The on-site monitoring results also prove that the overall internal force level of the pipeline is within the safe range,and there is no need to take protective measures for the gas pipeline t

33、emporarily.Key words:shield tunnel;excavation of foundation pits;gas pipeline;numerical simulation;on site monitoring;Zhuhai TunnelOptimization of Shanghai Variable Lane Cluster Control Based on Multi-Objective Programming&Hybrid Genetic AlgorithmCHEN Xi1,ZOU Jie2(1.Shanghai Urban Construction Design&

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服