[发明专利]一种机械图中标注串的提取方法有效
申请号: | 202010862023.9 | 申请日: | 2020-08-25 |
公开(公告)号: | CN111814801B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 伍瑞卿;张琳琳;莫晨曦;陈岳涛;辛华;彭子威;伍文福;郭光明;陈伟;顾庆水 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19;G06K9/62;G06T5/30 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 李林合 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机械 标注 提取 方法 | ||
本发明公开了一种机械图中标注串的提取方法,其包括根据字符和几何线条的形态特征差异性分离出所有字符,并获得字符特征向量;接下来,采用DBSCAN算法对特征量进行聚类分析;最后,对聚类后每类字符进行定向生长的分割,直至完成字符串的提取工作。实验结果表明,本方案提出的自适应聚类标注字符串提取方法准确度高,运行速率快。
技术领域
本发明涉及字符串提取技术,具体涉及一种机械图中标注串的提取方法。
背景技术
机械图纸中的字符标注是机械零部件的设计、加工和检验零件的重要数据。字符串及标注信息的提取是机械图纸的计算机自动化处理极为重要的组成部分,也是进行高层次知识理解的基础。人工阅读图纸和记录图纸中标注参数,具有工作繁琐、劳动强度大,对记录者的耐心与细心的要求特别高。因此,计算机自动提取和识别标注串可以加快识别、理解、管理图纸,提高检测质量,解决人工长时间阅读图纸带来的疲劳、注意力容易不集中、效率低等问题。从机械图纸提取标注串通常分为字符检测和字符重组两个环节。字符检测也称为图文分离,就是将字符与几何线条分离。字符重组又称为字符聚类,将属于同一个标注串的字符组合聚集在一起。
国内外研究者对字符检测和识别的研究起步较早,已经提出了许多方法用于提取场景文本图像、数字视频、历史文档等字符。对于机械图纸中字符提取的研究也已取得了较多的进展,常用的文本提取方法分为基于连通域的提取方法、基于边缘特征的提取方法、基于颜色和字符特征提取方法和基于阈值的字符定位等几类。
基于阈值的字符定位同样热门,AI-Hmouz R等人Gazcon N F等人是通过恰当的连通域阈值以及尺寸阈值,将图像中的目标字符从图像中分离开来。这种方法需要人工标定,针对不同的情景以及复杂的图像会有较好的效果。但是对于不同的图像,就需要设定不同的阈值,不能够灵活的自适应确定阈值。
对于机械图纸中字符串的提取,在基于聚类的提取方法中,He等人利用完整连接算法进行聚类来提取字符串,该方法只适用于图中标注串为同一方向的场景。戴维等人根据二值图像背景区域特征,对图像进行聚类分块,再利用图像区域特征,聚类获得出文字区域。朱健菲等人采用基于回归线的K-Means聚类算法由回归模型引导粘连字符像素聚类,实现粘连字符分割与所属文本行标注。但是利用单一的聚类方法组合字符串时,可能会将上下紧密相邻的两个水平标注的字符串归并成一个字符串。
在基于线性分析的字符串提取方法中,利用Hough变换方法对字符的中心位置进行线性分析获得字符串,利用字符的中心点是否共线和字间距离是否满足某个阈值条件来进行字符串的提取,但是两种方法只适用于字符串中字符数量多且字符的中心大致落在同一直线上,对于机械图纸中含有上下标的字符串并不适用。
综上分析,现有的方法虽然在不同程度上实现字符检测和字符串的重组,但是利用的图像特征较少,或者依赖于某些特有的特征,重组字符的方法鲁棒性不高,难以适应存在各种布局方向的标注串。
发明内容
针对现有技术中的上述不足,本发明提供的机械图中标注串的提取方法解决了现有技术不能适应存在各种布局方向的标注串的问题。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种机械图中标注串的提取方法,其包括:
S1、采用图文分离算法对机械图纸中的字符和图纸进行分离,之后分别提取每个字符的特征向量,并采用所有字符的特征向量构成特征向量集合;
S2、获取距离阈值,并根据距离阈值,采用DBSCAN算法对特征向量集合中的元素进行聚类形成多个簇;
S3、判断每个簇中的字符数量是否大于等于预设阈值,若是,根据预设距离,采用DBSCAN算法对簇中特征向量进行聚类形成多个簇,之后进入步骤S4;否则直接进入步骤S4;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010862023.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多头一体式自动供料螺丝机
- 下一篇:一种口罩消毒装置