[发明专利]一种畸变喷码字符逐层分割的方法有效
申请号: | 202010707261.2 | 申请日: | 2020-07-21 |
公开(公告)号: | CN111860521B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 黄军辉;王昭;杨程;祁苗伟;高建民;张厅方 | 申请(专利权)人: | 西安交通大学;东方电气集团东方汽轮机有限公司 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V30/24 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 闵岳峰 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 畸变 码字 符逐层 分割 方法 | ||
本发明公开了一种畸变喷码字符逐层分割的方法,该方法综合三种字符分割思路:连通域框选法、灰度投影波谷探测法、平均分割法;将文字连通域由粗至细三次细分,其中“连通域框选法”解决“灰度投影波谷探测法”易受喷码点阵空隙干扰的问题,“灰度投影波谷探测法”解决“平均分割法”在分割畸变长字符区域累积字符数判断误差的问题。相比单一字符分割方法,本发明在应对一定程度畸变的喷码字符分割问题上展现出更强的鲁棒性,同时子区域逐层细分的结构限定三种分割方法的作用范围,不会由于方法本身带来额外的分割误差,由此带来更高的喷码字符分割正确率。
技术领域
本发明属于图像处理、光学字符识别领域,尤其涉及一种畸变喷码字符逐层分割的方法。
背景技术
某工件喷码字符是产品参数、质量等指标对应具体工件的重要身份信息。目前喷码字符的识别主要依赖人工视检。通用字符识别方法对喷码字符应用难点主要在于字符分割,由于喷码字符由离散点阵组成,字符间隔特征不明显,字体内的点阵空隙会造成对应方向的灰度投影值下降,对分割造成干扰;此外,当喷码方向无法垂直工件表面时,将会造成不同程度的字符畸变与字符大小、间隔变化,此时基于先验知识的字符分割方法在处理长字符连通域时将积累误差,当误差积累达到一字符长度时,将会造成错误分割。该工件生产线上的快速喷码环节正属于上述情况。目前,就这一问题未有有效解决方法。
发明内容
本发明的目的在于解决上述现有技术中的问题,提供了一种畸变喷码字符逐层分割的方法,该方法结合连通域分割思想、灰度投影波谷探测分割思想、平均分割思想,由粗至细逐层分割文字区域,有效减小喷码字符畸变带来的影响,并提升分割算法鲁棒性。
为实现上述目的,本发明采用以下技术方案予以实现的:
一种畸变喷码字符逐层分割的方法,包括以下步骤:
1)对输入图像进行对中与旋转矫正,使得目标检测工件处于视场中央,喷码字符文字沿水平方向排列;
2)剪裁喷码字符区域,并对剪裁区域边缘进行压缩,使得剪裁区域边缘紧贴文字,接着判断剪裁区域文字是否颠倒,并予以矫正;
3)对上述剪裁区域使用纵向矩形模板进行闭运算以粘连离散的文字点阵,得到向性粘连图;
4)统计向性粘连图内连通域信息,并根据连通域面积的特征去除无关噪声,并得到符合标准的含有文字信息的子区域集合a;
5)遍历子区域集合a中子区域,依次判断子区域横向长度,对于大于预设三字符长度的子区域,绘制其纵向的灰度投影曲线,并通过分割指数计算方法选择最可靠的分割点,分割子区域后更新子区域排序;
6)重复步骤5)直至所有子区域横向长度不大于预设三字符长度,并得到子区域集合b;
7)通过加权的方式结合基于预设字符宽度预测字符数、子区域纵向灰度投影“波峰—波谷”对组数预测子区域集合b中每个子区域中的内含字符数,对子区域进行平均分割,得到子区域集合c;
8)通过空间坐标位置关系,补全子区域集合c字符间的间隔空间,使得子区域集合c构成连续的字符行并包含完整的喷码字符信息。
本发明进一步的改进在于,步骤1)中,首先对输入图像进行二值化,通过计算二值化图像重心与图像中心偏移量确定平移偏移矫正量;接着提取文字图像所在灰度区间,并筛选过滤像素面积超过文字区域的连通域与像素面积小于0.5倍喷码点面积的连通域,得到初步降噪的文字二值图像,通过计算文字在各角度的灰度投影,寻找投影峰值对应角度作为旋转偏移矫正量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;东方电气集团东方汽轮机有限公司,未经西安交通大学;东方电气集团东方汽轮机有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010707261.2/2.html,转载请声明来源钻瓜专利网。