[发明专利]一种文本图像中噪声线段消除方法及装置有效
申请号: | 201911348854.8 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111160209B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 刘宁;吴志超;胡茜;王静;董婉;申亚男 | 申请(专利权)人: | 北京爱医生智慧医疗科技有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/14;G06V30/164 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张秀程 |
地址: | 102206 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 噪声 线段 消除 方法 装置 | ||
本发明实施例提供一种文本图像中噪声线段消除方法及装置。所述方法包括在文本图像上筛选出小于灰度阈值的待测像素点;将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;根据各待测像素点间的连接关系,得到长度超过预设线段长度阈值的噪声线段;根据噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作,本发明实施例通过文本图像的灰度阈值确定待测像素点,并与满足预设连接条件的相邻待测像素点进行连接,以得到噪声线段,再利用对应的线段外像素点的灰度值,对线段内像素点的灰度值执行消除操作,从而能够简单快速得在所述文本图像中消除所述噪声线段对于文字识别的影响,提高识别效率。
技术领域
本发明涉及图像识别技术领域,尤其涉及一种文本图像中噪声线段消除方法及装置。
背景技术
文本图像光学字符识别(Optical Character Recognition,OCR)识别技术是图像识别领域中一个重要且广泛应用的分支,在很多实际常用中都有应用,如票据识别、车牌识别、证件识别、手写识别等,OCR识别技术可以通过技术手段降低人工录入成本。OCR识别技术主要包括文字定位和文字识别两个部分。
在一些实际场景中,如打印的票据,学生作答的作文中等,常会有一些文字压线的现象,这种压线现象给文本定位和识别都带来了困难,降低了它们的准确率。
发明内容
由于现有方法存在上述问题,本发明实施例提供一种文本图像中噪声线段消除方法及装置。
第一方面,本发明实施例提供了一种文本图像中噪声线段消除方法,包括:
在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点;
根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接;其中,所述X轴方向为预设的噪声线段沿伸方向;
根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段;
根据所述噪声线段外的线段外像素点的灰度值,对所述噪声线段内的线段内像素点执行预设的消除操作;其中,所述线段内像素点与对应的线段外像素点的X轴坐标相同。
进一步地,所述在文本图像上筛选出灰度值小于预设灰度阈值的待测像素点,具体包括:
根据所述文本图像上各像素点的灰度值,得到所述文本图像的平均灰度值;
将灰度值小于所述平均灰度值的像素点,作为待测像素点。
进一步地,所述根据预设X轴方向,将各待测像素点与满足预设连接条件的相邻待测像素点进行连接,具体包括:
若所述待测像素点在所述X轴方向侧存在至少一个相邻待测像素点,根据各相邻待测像素点与待测像素点间的灰度值的差值,计算各相邻待测像素点的惩罚因子,并进行比较;
若最小的惩罚因子小于预设的惩罚阈值,则将所述待测像素点与所述最小的惩罚因子对应的相邻待测像素点进行连接。
进一步地,所述根据各相邻待测像素点与待测像素点间的灰度值的差值,计算各相邻待测像素点的惩罚因子,具体包括:
若所述待测像素点到相邻待测像素点的方向与所述X轴方向一致,则所述惩罚因子等于所述待测像素点与相邻待测像素点的灰度值的差值;
若所述待测像素点到相邻待测像素点的方向与所述X轴方向不一致,则所述惩罚因子等于所述灰度值的差值与预设惩罚系数的乘积。
进一步地,所述根据各待测像素点间的连接关系,得到在所述X轴方向上长度超过预设线段长度阈值的噪声线段,具体包括:
将存在连接关系的待测像素点归入同一像素点集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱医生智慧医疗科技有限公司,未经北京爱医生智慧医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911348854.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序