[发明专利]一种图签识别方法有效
申请号: | 200810216795.4 | 申请日: | 2008-10-17 |
公开(公告)号: | CN101388079A | 公开(公告)日: | 2009-03-18 |
发明(设计)人: | 黄天祥 | 申请(专利权)人: | 纬衡浩建科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市万商天勤知识产权事务所(普通合伙) | 代理人: | 顾光一;王志明 |
地址: | 518020广东省深圳市罗湖*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 方法 | ||
技术领域 本发明涉及一种图签识别方法,尤其涉及一种基于单元格拓扑关系的CAD设计图纸上的图签识别方法。
背景技术 随着计算机辅助设计(CAD)的普及,电子图档在设计企业的生产和管理中发挥的作用也越来越大,受到重视的程度日益提高。许多业主在接收设计图纸的时候,往往还要求设计企业提供与之对应的电子图档。电子图档在再利用方面有着纸质图纸无法比拟的优势。如果设计企业对多年来积累的电子图档能有效管理,能在大量的历史图档中找到和当前工程设计有关的图档并有效利用,就能够大大节省重新设计的时间,带来可观的效益。但是,海量的电子图档,也带来了管理上的难题。为了把这些图档进行有效的分类,必须提取图档中的工程、专业、设计者等有效信息。
图档中的关键信息,往往存在于“图签”(Title Box)中。如图1所示,是图纸中的图签的示意图。图签10类似于一个表格,记录了设计企业的信息,设计者的信息,以及工程编号,图名等具体的工程信息,对图档的用途有说明作用。几乎所有正式打印交付的图档都有图签。因此,图签信息对于检索图档有着至关重要的作用。目前提取图签信息是一个重复和繁琐的手工录入过程,面对海量的图档,工作量非常大,而且容易出现人为的错误。
自动提取图签信息的研究已经有一些成果。这些研究都集中于通过定制模板来实现图签信息的读取。因为同一设计单位的图签都具有相似的布局,因此定制模板的方式能解决相当部分图签的读取问题。然而,迄今这些识别方法都是针对相对固定的图签格式,主要借助图签中的特征文字进行识别,无法解决在实际应用中出现的图签变化问题。这些问题包括:
●图签布局的变化。图签虽然有大致的布局,但往往没有严格统一的规范;同时由于CAD绘图方式的多样性,设计人员也容易随心所欲的对图签进行一些修改。比如,因为文字太多,存放文字的单元格被拉长、加宽或移位。这类布局的变化,会导致识别失败。
●相似的图签引起的重复识别问题。许多图签看似相同,实际上存在变化,特别是信息的提示文字-关键字发生变化,使得一个模板无法同时适应多种图签。如果针对每一种变化制定一个模板,又容易出现重复识别的问题,即某些图,能同时适用于多个模板。特别是图签格式比较多的时候,不同的模板之间很难完全区分开,这种情况非常容易发生。
●没有关键字指引的单元格的识别与定位。有些单元格没有明显的关键字在附近,但是又必须准确识别。
发明内容 本发明的目的在于克服现有技术的不足,提出一种图签识别方法,通过对图签共性的提取,制定一套匹配的规则,对图签中的单元格进行准确定位,读取单元格中的文字,提取出图签信息。
本发明公开的一种图签识别方法,用计算机程序自动读取电子图档中的图签信息,包括如下步骤:
第一步,读取所述电子图档中的文字和直线,再归并所述文字和直线,然后排序;
第二步,取出一个模板;
第三步,根据所述模板的设定,寻找所述电子图档中的一个关键字及其关键字单元格;再重复执行如下步骤A,直到无法在所述电子图档中找到新的单元格或搜索范围超出所述模板定义的范围为止;
步骤A:以已经找到的关键字单元格为中心,根据所述模板设定的图签搜索范围在所述电子图档中寻找所述已经找到的关键字单元格周围的所有单元格;
记录所述已经找到的所有单元格相互之间的拓扑关系,并与所述模板中不同关键字单元格之间的拓扑关系进行匹配,如果匹配成功则进入下一步,否则回到第二步,在第二步中取出下一个模板;
第四步,根据所述模板定义的关键字单元格与其它值单元格、混合单元格 和组单元格之间的拓扑关系,寻找所述值单元格、混合单元格和组单元格并提取其中的信息;
第五步,如果所述计算机程序中还有其他模板,则回到第二步,从所述其他模板中取出下一个模板,否则合并处理每一个模板的识别结果,消除其中重复的部分。
所述第一步中归并所述文字和直线的方法包括:提取具有不同CAD图元类型的文字和直线的位置和内容参数,把所有不同类型的文字和直线分别归并为同一类型的文字和直线;把方向相同、首尾相连或中间部分重复的直线合并为一条单一的直线;把误差范围内略微倾斜的直线调整成为角度为0°或90°的直线。
所述第一步中排序的方法是把所有的直线和文字分别按照坐标位置排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于纬衡浩建科技(深圳)有限公司,未经纬衡浩建科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810216795.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生成业务单据凭证的方法及装置
- 下一篇:一种基于领域本体的语义索引方法