收藏 分销(赏)

从CAD图形中获取工艺信息的方法模板.doc

上传人:精*** 文档编号:2509584 上传时间:2024-05-30 格式:DOC 页数:53 大小:2.44MB
下载 相关 举报
从CAD图形中获取工艺信息的方法模板.doc_第1页
第1页 / 共53页
从CAD图形中获取工艺信息的方法模板.doc_第2页
第2页 / 共53页
从CAD图形中获取工艺信息的方法模板.doc_第3页
第3页 / 共53页
从CAD图形中获取工艺信息的方法模板.doc_第4页
第4页 / 共53页
从CAD图形中获取工艺信息的方法模板.doc_第5页
第5页 / 共53页
点击查看更多>>
资源描述

1、从CAD图形中提取工艺信息方法摘 要本文将针对目前各个生产单位工程CAD图纸不一样模式及其现有系统单一功效缺点,提出支持多模式CAD信息智能提取算法。以DPM技术为基础,进而提出构筑CAD/CAM/CAPP集成系统模型。在此将关键讨论CAD模板定义,信息提取算法,CAD数据和PDM数据交换,和集成系统模型和实现等问题。关键词 : 信息提取 PDM CAD/CAM/CAPP 集成系统AbstractThis paper will aim at different model engineering CAD of every unit of produetion and the defect of

2、 singleness function in existence system,present the algorithm of supporting multi- model extracting information from CAD intelligenly, further present constructing the model of CAD/CAPP/CAM integrated system on the basis of PDM technology. In here we mainly discuss the definition of model and the a

3、lgorithm of data extraction and the data exchange between CAD and PDM,finally discuss the instance about above,then present a model about system integration.Keywords:Information Extraction, Porduct Data Mnagaement,CAD/CAM/CAPP,lntegration System 目 录第一章 绪论51.1 引言51.2 工程CAD图信息智能提取研究综述61.3 本文研究关键内容7第二章

4、 表格文档逻辑结构和数据提取算法82.1 文档表格基础结构82.2 标题栏数据栏间依靠关系102.3 基础表格和数据栏区域组成矩形模型102.4 逻辑结构提取方法112.5 逻辑结构提取算法改善一数据栏矩形区域投影算法14第三章 多模式CAD图纸信息智能提取和回写技术173.1 经典CAD图纸模板及表结构定义173.2 CAD图纸表格语义关联约束193.3 CAD图纸自由表格矩阵表示223.4 CAD图纸子表提取方法24第四章 CAD智能提取系统和信息共享应用实例模型294.1 支持多模式CAD智能提取系统实例294.2 基于PMD为关键系统整合模型38第五章 结论43参考文件44致 谢47第

5、一章 绪论1.1 引言伴随计算机技术飞速发展,在国民生产过程应用CAD技术手段也逐步成熟起来了。很多企机关全部在这个成长阶段发掘CAD技术用武之地,所以出现了各式各样CAD软件和处理技术。可见,CAD技术在各个领域发挥着关键作用。传统制造业生产过程正发生着深刻变革,优异制造技术正在显著地提升企业产品质量、经济效益和市场竞争力。越来越多企业将优异制造技术作为企业适应快速多变市场需求和提升竞争力关键手段。优异制造技术还在大幅度改善企业产品结构、生产过程和经营管理模式上发挥关键作用。越来越多企业把能够高质量、快响应、灵活、灵敏地满足用户需求优异制造技术作为企业继续生存并保持发展有效路径。优异制造技术

6、强调过程集成和过程重组,显著区分于传统制造技术单纯从技术角度提升设计水平、制造手段和生产率做法。优异制造技术更强调管理技术、制造技术和信息技术结合。而且,优异制造技术出现,使得企业组织结构也从在从传统功效组织结构向过程组织结构改变。制造业信息化经过十几年发展,取得了长足发展,尤其是最近5年发展尤为快速,新概念不停出现,新软件产品不停开始在企业得到应用。制造业企业信息化是一个大系统工程,包含CAD技术、CAPP技术、PDM技术、ERP技术。现有纯技术,也有管理,我们结合多年上百家企业信息化工作实践经验,对照信息化工作各个阶段,可知制造业信息化多个关键步骤和需要关键考虑清楚问题。从CAD到ERP整

7、个系统数据信息流动方法,PDM管理CAD产生产品图纸,并从CAD图纸中提取标题栏、明细栏信息,并产生产品结构树,整理后导入到PDM系统中去,对于三维CAD则经过读取图纸文件中统计结构数据来产生产品结构树。经过PDM系统来维护企业产品结构信息、版本信息、进行数据版本更管理、产品数据工作步骤管理、图文档查询管理等,这里PDM充当了品开发一个管理平台。工艺部门组织产品生产工艺编制和生产准备需要设计部门PDM提供产品结构信息和产品图纸信息。经过工艺管理系统,工艺部门组织工艺编制,工艺路线组织,而且汇总产生生产一线需要多种报表,比如:产品明细及工艺路线表材料定额明细表工时定额表,而且对工艺信息实现有效权

8、限管理,工艺数据更改管理等。ERP即是生产管理平台,它技术数据起源于前端技术部门,它从工艺管理系统读取PBOM和多种汇总报表,来进行企业车间管理、生产管理等。从以上信息化过程能够看出,所需数据关键还是起源于CAD图纸。所以从CAD图纸正确提取数据信息过程是关键一步,不然整个CAD/CAM/CAPP集成系统正确率将受到影响。因为现在各企业所使用图纸模式各异,为了实现系统通用性,所以,实现多模式CAD图纸信息智能提取技术就显得越来越关键了。1.2 工程CAD图信息智能提取研究综述1工程CAD应用和发展计算机辅助设计(CAD)技术作为电子信息技术一个关键组成部分,是促进科研结果开发和转化、促进传统产

9、业和学科更新和改造、实现设计自动化,增强企业及其产品在市场上竞争能力,加速国民经济发展和国防现代化一项关键性高技术,也是深入向计算机集成制造(CIMS)发展关键技术基础。从广义上说,CAD技术包含二维工程绘图三维几何设计有限元分析数控加工仿真模拟,产品数据管理网络数据库和上述技术(CAD/CAE/CAM)集成技术等。CAD应用工程是和CAD技术研究开发推广应用相关高新技术密集大型系统工程。CAD应用工程实施,标志着中国在企业信息化信息企业化大道上取得了长足发展。CAD技术使用使产品和工程设计制造工作内容和方法发生了根本性变革,这一技术成为工业发达国家制造业保持竞争优势开拓市场关键手段。1990

10、年美国国家工程科学院将CAD技术评为现代十项最杰出工程技术成就之一。现在,CAD技术日趋成熟,应用日益广泛,有力地促进了全球高新技术发展和新产品快速更新换代。不采取CAD技术就不可能做到波音777大型客机无纸设计和无纸制造,使其设计制造成本下降30%以上。不采取CAD技术也不可能想象30多人在十天内完成一幢18层高层建筑方案设计和施工图输出。列举不尽这些优异产品和工程,无一不是采取CAD技术结晶。中国作为发展中国家,即使CAD技术开发应用和发达国家有差距,但也取得了很多辉煌成就。CAD作为关键性应用技术,己经在中国机械制造建筑工程轻工化纺船舶汽车航空航天影视广告等领域起到催化加速倍增器作用。C

11、AD技术在中国建筑工程业应用深度和广度,和发达国家差距并不显著,其使用效果比发达国家还好。有中国自主版权CAD支撑软件及其应用软件,已能满足中国企业甩掉图板要求,并己形成了一定产业规模。现在,CAD作为关键共性技术,其广泛应用必将促进大家思想观念工作模式、生产方法转变。工程CAD图纸设计及其在制造业广泛应用,促成了现代优异制造系统诞生,CAD/CAM/CAPP/PDM等集成应用系统发展就是CAD应用典范。2CAD图纸信息智能提取研究现实状况现在对工程图信息识别方法关键有两类:前处理法和后处理法。前处理法是在工程图纸中预定义信息承载对象,再将信息附加到对象上,信息识别时能够经过查询对象附加属性来

12、实现。该方法识别效率和正确程度全部较高,但其前提条件是图中存在预定义对象,这就限制了它在未预置指定对象工程图中应用。后处理法经过分析工程图上信息几何、语义等相关特征,获取所需数据。该方法克服了前处理法对工程图限制,适用范围广,能够处理不一样格式信息,但对不规则程度较高实体识别正确度及效率全部有待深入提升。从图形中提取信息方法中国外相关研究内容关键是:(1)基于约定语义或简图实现工程图信息提取。一个是分析工程图样中标题栏、明细表及产品/部件汇总表形式和内容,归纳了工程图中表格数据特点,提出了用自由表格矩阵表示法有效处理工程图中自由表格结构提取问题,和从表格获取零部件信息方法,如现在比较前沿GGL

13、算法等。另一个是提出了基于装配简图和装配语义轴类零件信息提取方法,以支持自顶向下设计过程,如基于零部件特征提取法等。(2)对于特定CAD图形,经过将其转换成己知中性文件格式IGES或STEP,然后经过对转换后文件实现信息提取。(3)针对特定CAD系统生成图形,采取其提供开发工具或针对其特定格式进行信息提取。比如针对AUTOCAD图形,利用AUTODESK企业提供二次开发接口ObjectARX或经过AUTOLISP语言操纵,或经过DXF(Data Exchange Format)交换文件格式读取,或经过ActiveX Automation进行信息获取。1.3 本文研究关键内容1研究目标和意义从计

14、算机辅助设计技术发展能够看出,在不一样产品模块化系列设计过程中,将尽可能满足同一产品在设计过程中资料共享,避免反复输入各零件设备参数。所以,基于产品数据管理DPM为关键一体化集成系统数据信息共享,将最大程度地被后续各生产阶段所利用。这些数据信息入库保留和管理是实现产品一体化集成关键。本文针对不一样企业全部有自己不一样CAD软件和图纸模板,愈加好地管理这些CAD图纸和可再利用资源,提升生产产品效率,所以致力于研究怎样获取不一样模式结构CAD图纸数据信息,并把这些信息保留到系统对应数据结构中和创建产品零部件和产品结构树,是至关关键;同时也可为零部件工艺生产提供可靠数据,实现生产一体化。为实现制造业

15、优异生产管理奠定了一定基础。2研究内容论文工作在于研究多模式CAD图纸数据智能提取和数据共享等技术应用。所以文章首先经过对CAD工程图纸模板怎样定义,研究快速进行模型特征匹配和数据提取算法,输出多个数据格式及表格数据,构建一个支持多模式CAD图纸智能数据提取集成应用平台。在此,图纸模式定义、快速数据提取匹配算法、及构建智能系统平台是需要处理关键问题。从而提出系统体系平台结构并对系统中关键技术进行叙述和介绍。最终经过实例对多模式及改善快速提取算法等进行验证。第二章 表格文档逻辑结构和数据提取算法通常来说,一张表格能比较正确明了地表示大家所要说明信息。讨论怎样获取表格中内容表现出越来越关键了,在信

16、息时代,就必需愈加紧速传输和处理这些有用信息。所以自动获取表格文档信息相关研究成为一个关键课题。类似通常表格图档,需要关注是表格几何结构(又称分布结构)和逻辑结构。表格几何结构通常指是一个物理性质,如表格位置、字符大小和其百分比关系等;而逻辑结构指是表格内部固有一个关联关系。所以,表格文档分析也就包含这两方面分析,即分布结构分析和逻辑结构分析。CAD数据提取算法研究是建立在通常表格文档数据提取方法之上,其中很多理论和算法全部能够效仿和采纳。所以,充足认识和了解表格文档在逻辑结构和数据提取方面理论是至关关键。以前对表格文档分析己经提出了很多方法,在逻辑结构方面提取技术通常包含较少,下面我们将具体

17、介绍一个表格文档逻辑结构提取算法。这个算法(简称GLG算法)包含三部分:整个文档全局划分;含有逻辑结构分析;整个文档全局再划分。这种算法关键点是逻辑结构划分,含有较高正确率,它有利于逻辑结构树生成。同时,它健壮性还表现在使用额外直接相邻关系处理两个不相关表格。最终将在GLG算法基础上深入介绍一个逻辑结构提取改善算法数据栏矩形区域线段投影法,该算法从线段投影长度反应区域面积大小,合理地划分区域所表现逻辑结构,依据区域划分最大化标准,一样有利于逻辑结构树生成。2.1 文档表格基础结构工程CAD图纸技术数据通常以表格形式存在,其存放形式及组成方法均不一样于一般图形或文本信息。表存放形式取决于承载它图

18、形文件,并随文件格式不一样而改变;表组成方法则取决于图纸绘制所采取标准并随之改变,因为表存放和组成含有分散性、独立性和多样性等特点。表格栏是由部分水平和垂直线段围成矩形区域组成。然而这种表格文档布局结构能够经过对线段分析取得,在表格文档中存在两种字段,分别是数据段和标题段。数据段是为用户填写区域,标题段用来指出它隶属数据信息。表格文档包含有两种结构,分布(几何)结构和逻辑结构。分布结构是指表格文档位置、大小和各字段百分比关系等;而逻辑结构是指字段间逻辑关系。表格文档分析由两个阶段组成:分布结构分析和逻辑结构分析。通常来说,一个完整表格文档是经过两组水平和垂直边缘线形成矩形区域。它还能分成多个相

19、对独立矩形表格。这里我们称这些独立表格为规范化表格。从结构复杂性考虑,我们把规范化表格分为基础表格和复合表格。基础表格也能够分为一维表格和二维表格。表格文档结构和规范化表格分类以下图2.1示:图2.1 文档结构图一维表格定义是递归,最简单一维表格是由一个标题栏和它隶属数据栏组成,而一个标题栏和多个隶属一维表格标题栏将形成另外一个一维表格。这个标题栏称为对应一维表格标题拦总标题;有时这个一维表格仅仅是由多个没有总标题隶属一维表格标题栏组成。图2.2所表示:图2.2 一个没有总标题单向一维表格示例在一个最简单一维表格标题栏是第一层标题,对应表格称为第一层一维表格。层增加伴伴随表格也复杂起来。标题层

20、图2.3所表示。而且,在一维表格中,标题栏基础上全部在数据栏一边,称为单向一维表格,图2.2所表示。总标题 上标题第一层标题 第二层标题 第三层标题 左标题图2.3 一维表格示例 图2.4 二维表格示例一个二维表格是由一个总标题栏、多个左标题栏、多个上标题栏和数据栏组成。图2.4所表示。实际上,它能够被看作是一个总标题栏和两个单向一维子表格组成。一个是由上标题和数据栏组成,另一个是由左标题和数据栏组成。它们数据栏相同,只是每一个数据栏依靠于两个方向标题栏。这两个表格各自称为二维表格D1子表和D2子表。复合表格定义也是递归。一个复合表格是由一个总标题栏和多个子表组成,而且子表能够是一维、二维和其

21、它复合表格组成。能够看出,这个复合表格能够视为一维表格拓展,它们不一样在于子表类型不一样。而且,数据栏和表格间不是直接相邻形成一个矩形,从而把它归类到一个复合表格。尽管它子表是一维,图2.5所表示两个复合表格。 图2.5 复合表格示例图以上给出了3种规范表格类型递归定义。能够看出这些定义基础是从一维表格开始,又依据一维表格层次关系,能够得出栏目间逻辑关系。数据栏依靠于第一层标题栏,第一层标题栏依靠于更高层标题栏,依次类推。图2.3所表示,数据栏Dl、DZ、D3分别依靠于T2、T3、T4,T3、T4依靠于T5,T5和T2依靠于Tl。2.2 标题栏数据栏间依靠关系从布局结构见解分析,watanab

22、e将标题栏和它隶属数据栏依靠关系划分为四类型。分别图2.6(a)-(d)所表示。Liubing等将这四种依靠关系延伸为两种关系类型。一个是标题栏和它隶属数据栏,另一个是标题栏和它子表关系。而且另外一个关系类型,nxn水平依靠,图2.6(e)所表示,也被应用。这种nxn水平依靠也常见在表格文档,这种关系类型也仅仅使用在标题栏及其带有横向一维子表之中。六个规范化表格和它们依靠类型图2.6所表示。 (a) 1-垂直依靠 (b) 1-水平依靠 (c) n-垂直依靠 (d) n-水平依靠 (e) n x n-水平依靠图2.6 标题栏和数据栏或子表依靠关系分类2.3 基础表格和数据栏区域组成矩形模型一个由

23、标题栏和数据栏组成规范化表格,总是能够形成一个矩形。对于一个基础表格,直接相邻数据栏间也能够形成一个矩形区域。图2.7所表示表格。这个特征称为基础表格矩形化。数据栏组成矩形被称为数据栏矩形,经典数据栏矩形图2.8所表示。栏间直接相邻关系指是相邻两种类型,图2.9所表示。 (a) (b) (c)图2.7 基础表格和数据栏区域组成矩形 (a)横向邻接 (b)纵向邻接图2.8 经典数据栏形成矩形 图2.9 栏间直接相邻关系两种类型依据以上对表格文档结构分析,能够得出基础表格三种标题栏和数据栏位置关系表格模型,图2.10所表示。对复合表格,数据栏总是能够组成不一样矩形,图2.11所表示。每一个数据栏矩

24、形对应基础表格子表或复合表格子表一部分。在复合表格中总标题显得比较关键了,因为它能够视为多个基础表格和多个总标题栏组成。 (a) (b) (c)图2.10 基础表格标题栏数据栏形成矩形模型(标题栏、数据栏) (a) (b) (c)图2.11 复合表格标题栏数据栏形成矩形模型2.4 逻辑结构提取方法在了解了表格文档基础结构后,就必需更深入研究表格逻辑结构提取方法。因为逻辑结构选择正确和正确性事关表格语义了解,从而才能正确地提取想要得到数据。逻辑结构提取方法能够采取全局一局部一全局划分方法(GLG算法)和数据栏矩形区域投影算法改善。以下两节内容将具体描述两种算法:GLG算法经过对文档结构布局分析,

25、该方法关键是针对以上所介绍两种结构布局特征。其步骤为:表格文档全局划分,局部逻辑结构分析和全局文档再划分。分别描述以下:1整个表格全局划分依据基础表格矩形特征,首先找到预选数据栏矩形,然后提取对应来自整个表格基础表格。具体步骤有:第一步建立候选数据栏矩形列表在整个表格中,将数据栏区域划分成候选数据矩形而且把它们插入到候选数据矩形列表中。使用最大化标准,由直接相邻数据栏组成面积相对大矩形,作为一个候选数据栏矩形。比如,在表格中能取得7个候选数据栏矩形,图2.11所表示。有时,依据水平和垂直两不一样方向,能够将直接相邻数据栏分为数据栏矩形,图2.12将分成两个不一样数据栏区域。在通常情况下,将选择

26、水平线划分区域而形成矩形,其划分结果图2.12所表示。图2.12 数据栏区域结构划分图第二步对候选数据栏矩形列表排序首先在数据栏矩形列表中对这些矩形从顶端到底端进行排序,而且对于横向相关矩形,从左到右进行排序。图2.13所表示表格,在表格中数据栏矩形D1和D2是横向相关,D3和D4也是横向相关。这么候选数据栏矩形列表为Dl,D2,D3,D4。图2.13 数据栏矩形排序情况(标题栏区域、数据栏矩形)图2.14 不相关数据栏分组到同一数据栏矩形情况第三步对数据栏矩形提取基础表格矩形(1)对整个表格文档矩形,初始化没有处理区域;(2)在候选数据栏列表中取得第一个数据栏矩形;(3)让数据栏矩形底线和右

27、线作为参考线,在没有处理过文档区域里,往上方和左方方向扩展得到最大矩形,这么所得矩形被认为是基础表格矩形;(4)从目前未处理区域提取出基础表格矩形;(5)假如数据栏矩形列表不空,在候选数据栏矩形列表中取得下一个数据栏矩形而且继续回到第(2)步。有时在第(3)步对于数据栏矩形不能找到基础表格矩形,因为在一些特殊情况,两个数据栏分属于两个不一样基础表格,而且这两个基础表格相互直接相邻,而且已经分组到一个数据栏矩形中。比如,在图2.14中表格,数据栏D2和D4,分别依靠于标题栏T2和T4,在第(1)步可能被分组到一样候选数据栏矩形中。这么数据栏矩形将按以下算法进行处理:假如在数据栏矩形中有N行数据栏

28、;划分数据栏矩形为两个矩形,其中上面一个矩形为(n=N-1)行数据栏,则剩下一行(m=l)为另一矩形;根据上面介绍第(3)步在上面那个矩形找到对应基础表格矩形;假如基础表格被找到,跳到;假如n=l,上面矩形没有尤其意义,被认为是在文档中一条分界线,跳到;取出上方数据栏矩形最终一行,然后把这行放入下面矩形,这么n=n-l,且m=m+1。跳到;依据列表次序,将下面那个矩形插入到数据栏矩形列表。正如上面所描述一样,一个表格文档能被分成多个规范化表格,即基础表格和复合表格。而一个复合表格又能够深入划分成更多基础表格和标题栏。所以,经过全局划分阶段后,整个表格文档将划分为多个基础表格和多个单标题栏,这些

29、单标题栏没有被分组到基础表格矩形。2在每一个基础表格矩形中进行逻辑结构分析依据标题栏和子表及数据栏前四种依靠关系类型,能够经过分析每一个基础表格相邻关系判定栏间逻辑关系。对于每一个基础表格矩形,将实施以下步骤:第一步 找数据栏每一行每一列第一层标题栏从标题栏和它子表依靠关系前四种类型能够看出,第一层标题栏应该直接相邻其右侧或下侧一个或多个数据栏。这么经过分析它们邻接关系,标题栏数据栏能够被找到。数据栏每一行全部有一样左标题,每一列也有相同上标题。建立它们依靠关系后,每一个矩形全部由标题栏和它隶属数据栏组成,组成一个子表。第二步找更高一层标题栏和第一步相同,依据标题栏和子表依靠关系,经过子表递归

30、地合并成另一子表,能够找到更高一层标题栏。对总标题栏和在其中子表设置依靠关系。第三步反复第二步处理过程直到在基础表格矩形中没有未处理标题栏在二维表格中有一个总标题例外,有一个标题栏经过第一步和第二步不能被处理。它在基础表格矩形左上角,和基础表格数据栏矩形相反位置。当处理上面几步后,设置这么一个标题栏作为二维表格总标题栏。3重划分整个表格文档取得复合表格依据标题栏层次关系特点,对候选总标题栏经过搜索其子表便可识别出复合表格。第一步获取候选总标题栏存在两种情况标题栏能够被认为是候选标题栏。一个情况就是单标题,它没有分组到任何基础表格矩形中;另一情况就是总标题在单向一维表格中。理由是被考虑在基础表格

31、总标题是复合表格存在基础。图2.10(c)所表示。第二步对候选标题栏从右下方到左上方排序首先在纵向从下向上对矩形排序,然后在水平方向从右向左排序。第三步为标题栏找对应子表由上面讨论五种依靠关系描述,搜集总标题栏右下方子表,并把它们组合成复合表格。在第二步候选标题栏被排序理由是其右下方复合表格能被识别,对于更多复杂复合表格可能成为候选子表。依据以上介绍方法,表格文档处理过程图2.15所表示。 (a)原表格文档 (b)D1-D7为已排序数据栏矩形 (c)B1-B7为基础表格矩形(整个表格全局划分) (d)C0是整个表格再划分得到复合表格图2.15 表格文档全局划分过程:( c)为经过处理结果;(d

32、)为经过处理结果2.5 逻辑结构提取算法改善一数据栏矩形区域投影算法由上一节我们知道,矩形是经过水平和垂直两方向线段组成规则区域。表格正是矩形一个实例化表示。矩形区域也存在水平和垂直方向上投影,而且其最终将形成一条线段。图2.16所表示,规则矩形区域数据栏在水平和垂直两方向上投影均为一线段,能够从两个方向考虑,包含水平方向和垂直方向。(这里假设标题栏在数据栏上方)图2.16 水平和垂直方向上数据栏矩形区域投影数据栏矩形区域投影法对数据栏区域划分步骤基础同GLG算法,只是在第一步建立候选数据栏矩形列表进行了简单改善,建立候选数据栏矩形列表方法简单描述以下:对图2.16数据栏区域划分,依据面积最大

33、化标准,由直接相邻数据栏组成面积相对大矩形,作为一个候选数据栏矩形。在工程CAD图纸中,因为图纸相对规范,数据栏高度通常也为定值,面积计算方法比较取决于两方面原因:水平方向考虑,面积是投影所得线段长度和数据栏在垂直方向上行数。加入一点人为要求划分规则,分两步:确定投影方向;从数据栏整体结构看,假如水平方向上独立数据栏多于垂直方向,考虑水平方向上投影,图2.16(左);假如垂直方向上独立数据栏多于水平方向,则考虑垂直方向上投影,图2.16(右)所表示;假如水平方向和垂直方向独立数据栏个数相等,则整个数据栏形成一个数据矩形区域,能够任意投影,图2.8所表示,不然进入步骤。划分基础数据栏;i)假如投

34、影在水平方向,这么垂直方向上存在以下情况:当第一行最终没有独立数据栏,则划分将和使它完成水平相连数据栏一起组成基础数据栏;依次类推;ii)一样,假如投影在垂直方向,这么水平方向上存在以下情况:当左边有空缺独立单元格,则单独划分为一个基础数据栏,图2.16(右)。当有两个数据单元格存在时,必需考虑面积最大化标准。使用上述规则基础步骤,很轻易判定划分数据栏区域,从而得到基础数据栏,待插入到侯选基础数据栏列表。划分结果见图2.12所表示。为了愈加清楚了解上述规则,图2.17所表示为两个数据拦表格通常划分情况。数据栏矩形区域投影法划分数据栏很直观,正确率也相对高。能够省略判定不相关数据栏分组到同一数据

35、栏矩形情况(图2.14所表示情况),能够直接进入对基础表格进行逻辑结构分析阶段,这么效率也相对地提升。经过划分规则数次测试比较,发觉该改善算法在整体数据提取效率方面有显著改善。图2.17 数据栏表格划分示例图第三章 多模式CAD图纸信息智能提取和回写技术CAD技术推广应用显著地提升了设计能力和图纸质量,产生了大量频繁使用CAD图纸;目前以D系统对图纸等资料管理,产品配置管理等功效却没有支持。为了使用户能够愈加好管理大量CAD图纸,比如依据图号、项目、设计人、工作阶段、审批情况、日期、类型和预先定义各类参数(如材料、重量等)作为条件进行查询,必需搜集很多图纸内容数据。而这些图纸内容数据通常全部是

36、图纸标题栏和明细表中信息,假如经过逐一将旧图纸标题栏输入数据库中,将是一个量大又繁杂反复工作任务。因为CAD图纸表格和通常图表文档在结构方面一致性,在标题栏语义结构分析时,能够对照通常图表文件独立单元格结构,对其逻辑语义和结构进行分析;而明细栏刚好和图表文件结构相同,先对其进行逻辑结构划分,然后进行逻辑语义约束。考虑实现高效、正确地自动提取图纸标题栏信息,实现大量现存电子工程图档自动入库。具体,我们目前将先实现AntoDesk企业dwg图像中特定文字信息提取,以下技术方案也关键是针对dwg格式考虑,以后能够考虑实现支持其它CAD文件信息提取。我们期望在AutCoda平台上开发这么功效模块:i)

37、定义标题栏,明细栏模板。ii)劝根据模板对DWG格式电子图档标题栏、明细栏等信息无损失提取和自动入库。iii)对于非定义模板,也应该依据一定提取算法能够实现标题栏、明细栏等信息提取。iv)对AutoCAD应该支持版本R12,R14和R。v)提取过程中不能显式地开启AutoCAD。有了这些基础功效模块后,就能实现对多模式CAD图纸智能提取技术。所谓多模式,就是指以D图、标题栏和明细栏在CAD图纸中位置不一样形成不一样模板。因为每个企业全部有自己设计风格,自然模板格式也不一样,但同一企业设计模板通常相同。要实现对多模式CAD图纸智能提取,就必需使软件含有通用性,所以定义好图纸不一样模板格式是至关关

38、键。本文将从CAD图纸模板结构定义出发,逐步深入探讨模板内部元素结构和语义关联约束,从而最终实现CAD图纸信息智能提取技术。3.1 经典CAD图纸模板及表结构定义1概述在绘制工程图时,不一样企业可能依据不一样标准,如国家标准、部标、厂标等,标题栏和明细表样式并不一致。但在一个企业内部,所使用标题栏格式和明细表格式却是比较统一。处理这个问题最好方法是定义模板:对这些不一样式标题栏和明细表定义对应标题栏模板和明细表模板,而在一个企业内部,因为样式相同标题栏和明细表只需定义一次模板即可,这种定义只需一次或几次而己。假如不定义模板,直接提取图中全部字符串,然后按各字符串位置关系来识别字符串间语义关系,

39、这时即使也能够找到部分字符串间语义关系,但在大量复杂工程图纸中,不可能将全部相关字符串全部匹配上,而且匹配算法设计难度极大,匹配正确度低,运行效率也很低。所以这种方法不可取。经过人工定义模板,能够直接将含有一定位置关系单元格定义为相互之间有某种语义关系,剩下工作就仅仅是搜索哪些字符串落在单元格中,这就极大地简化了算法复杂度,并可将提取正确度提升到近乎百分之百,同时运行效率也有显著提升。2单元格分类模板定义工具应含有通用性,为此应对其中单元格进行了分类,见图3.1。图3.1 标题栏单元格分类图3.2所表示,图纸信息分为标题栏和各个可增加字表(包含明细表),在标题栏中又有两类信息单元:成对单元格和

40、独立单元。成对单元格成对出现,如“描图”单元格和“FFLin”单元格对应,这里称“描图” 单元格为名称单元(项目名称单元格),“FFLine”单元格为数值单元(项目值单元格);独立单元格仅有项目值,而无和之对应项目名单元格,如“国家标准机械制图”或“装配件”单元格。对于子表,通常其单元行数目不定,但每个表增加方向全部向上或向下,有表有表头,有表无表头。3模板定义方法模板定义能够采取两种方法:1)块模板:利用AUTUCAD中“图块”属性功效直接定义。这种方法是将图纸中标题栏和明细表做成对应图块。对标题栏块,将标题栏每一个图元信息全部做成一个属性,直接依据属性名称和数值从图纸中提取出图纸信息。对明

41、细表或其它子表,则是在表格数据块上定义好表头信息,读取时依据表头信息将数据区分开来。2)专用模板:使用专门模板定义工具,直接在图纸上定义多种信息提取格式。这种方法关键利用单元格位置信息和字符串对模板和图纸进行匹配。这两种方法各有利弊。第一个方法适合新绘图纸。一个企业只需做好一个或多个模板,在绘制新图纸时插入定义好图块即可。这种方法优点是利用图块属性能够做到信息正确定位和读取,而且能够利用图块特征方便标题栏编辑。最大缺点是不适合己经绘制好大批图纸企业(需要对每一张图纸进行人工处理)。这种方法最适适用于那些标题栏和明细表形式很不统一单位和企业。第二种方法比较灵活,适应性极强。不过要求一个企业内部模

42、板格式较为统一。在使用第二种方法定义模板时应包含以下信息:(1)整个标题栏基点和包围盒。通常取标题栏右下角为基点,整个标题栏中坐标值全部是对基点相对坐标。(2)全部单元格定位信息及匹配关系。包含单元格名称、包围盒坐标。和数值单元格相对应信息项。(3)全部子表表头信息,包含子表基点,表头各列宽度和相对应信息项,数据行高度,各信息行包围盒。总而言之,第二种方法愈加适应于企业情况,所以我们采取第二种方案开发信息智能提取系统。7GB8769-96螺母32A36GB8769-96M20螺栓32A35M-PART-05缸盖1A1044M-PART-04缸体1HT2053M-PART-03连杆8QT6008

43、08002M-PART-02活塞2ZG20208001M-PART-01曲抽2QT60060800主传动序号代号名称数量材料单重重量备注装配件国家标准机械制图标识处数更改文件号签字日期设计FFLin标准化QA-01图样标识数量重量百分比发动机总装绘图FFLin校对HIT-01审核E0-0118001:1M-ASM-00审核Master日期4-12-99共12页第1页图3.2 CAD图纸装配图样例表3.2 CAD图纸表格语义关联约束表信息即使在表现形式上是相对独立,但在逻辑上却是相互依靠和关联,而且信息之间存在着数据重合现象。为了确保数据一致性、唯一性和关联性,在表信息提取入库时,应进行关联重建

44、处理,使其达成逻辑上有机结合。1基于单元表内部关联约束CAD图纸中表格中单元格是由图形表格和文本内容共同组成。其中,就单元格结构来看,它是由水平和垂直线、文本字符串一起组成。而对于一个整体表格而言,能够将表格描述为三个集合一个共同体。具体以下:ljh, ljv, sk,其中ljh表示水平直线集,ljv为垂直方向直线集,sk为字符集。就单元格而言,它由矩形格r及其框内字符串s共同组成,含有图形和文本两种属性。其可表示为:u(r(Pbl,Ptr),s(Pb,t),其中r(Pbl,Ptr)为单元格边界,由组成单元格矩形区两对角点(Pbl,Ptr)坐标确定; s(Pb,t)是单元内容参数,由组成单元格

45、字符串基点Pb和文本t确定。图3.3所描述单元格各参数关系,其矩形区域和字符串存在约束关系,其基础约束条件为:Pb(Pbl,Ptr)。图3.3 单元格逻辑基础结构图图2.15相关标题栏、明细栏表结构表中,标题栏是由独立单元和成对单元组成,而成对单元是由名称单元和数据单元组成。所以对标题栏关键关注名称单元及数据单元逻辑语义和结构关系;另外对明细表,能够把标题栏视为类似情况。名称单元记为uf;数据单元记为ur。在CAD图纸表格中,名称单元通常是固定不变常量,而数据单元将伴随不一样表格改变。以图2.15所表示图纸为例,名称单元“重量”在同格式表中是相同,而和之对应数据单元值可能是800或不一样值。从

46、上一章中对文档表格分析知道,表格单元间关系能够分为几何位置(分布结构)关系和逻辑语义关系。CAD图纸中表格单元也包含这两类关系。逻辑语义关系c是指一组型、值单元在语义上相互依存,共同表示一条完整信息内容,如型单元“百分比”和值单元“1:1”共同表示了图纸绘制百分比信息,图3.2中关系。表示了uf和ur之间逻辑语义关系。同时,属于同一行或列单元之间存在着前驱p和后继s关联关系,图3.4中p和s分别表示了各uf和ur间前驱和后继关系。图3.4 单元格间逻辑语义关系图分布结构关系是指含有逻辑语义关联单元在表中相对位置,关键有以下多个:同行或同列且不相邻(没交点)、同行或同列且相邻(有2交点)、重合(共4交点),图3.5所表示。( a)单元格原始坐标图 (b)同行位置分布情况1 (c)同列位置分布情况2, 3(d)相交2点三种位置关系图4, 5, 6 (e)相交4点重合情况7

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 品牌综合 > 技术交底/工艺/施工标准

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服