[发明专利]一种基于灰度图像识别易混淆字符的方法及设备在审
申请号: | 202111142126.9 | 申请日: | 2021-09-28 |
公开(公告)号: | CN113837119A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 郑颖;刘武;王璇 | 申请(专利权)人: | 福州符号信息科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06T7/136 |
代理公司: | 福州科扬专利事务所(普通合伙) 35001 | 代理人: | 何小星 |
地址: | 350000 福建省福州市鼓楼*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 灰度 图像 识别 混淆 字符 方法 设备 | ||
本发明涉及一种基于灰度图像识别易混淆字符的方法及设备,所述方法包括以下步骤:输入原始图像,通过文字识别引擎识别图像中的字符类型,并判断该字符是否属于易混淆字符,若属于易混淆字符,则进行纠正处理;纠正处理包括以下步骤:获取该字符的灰度图像,遍历灰度图像中各像素点的灰度值,基于每一像素点及其相邻像素点的灰度差值计算各像素点的梯度值;选取一个梯度值作为梯度阈值,计算超过该梯度阈值的像素点的灰度平均值作为灰度阈值;根据灰度阈值,将灰度图像中灰度值大于灰度阈值的像素点的置为黑点,将灰度值小于于灰度阈值的像素点的置为白点,生成二值化图像;根据二值化图像中字符的形态轮廓,纠正该字符的字符类型。
技术领域
本发明涉及一种基于灰度图像识别易混淆字符的方法及设备,属于图像处理和文字识别技术领域。
背景技术
目前,国际上使用机读码种类大致有3种,多用于护照的2行*44个字符类型,用于身份证卡的2行*36个字符类型以及3行*30个字符类型。当前主要采用OCR识别技术来完成对这些证件的机读码的识读,这些证件上的机读码包含的持证人的相关身份信息,一般包括了证件号码、国籍、出生年月、姓名等数据。对于持证人的证件号码、国籍、出生年月等信息机读码区皆有其对应的校验算法来校验OCR识别结果的正确性,但是对于持证人的姓名以及各国选填的信息部分通常没有相关的校验算法,这就容易造成这部分没有校验的信息数据出现识别错误,需要人工进行校对以及手动矫正。虽然通过手动矫正可以提高识别的精确度,但是手动矫正是一个耗时费力的过程,识别速度有待提高。
一般在实际应用的场景中,电子设备会因为各种环境因素造成采集到的的图像出现不规律的灰度跳变,这就容易造成一些局部形态上存在着相似的字符之间的识别混淆,比如持证人姓名部分的字母类型中的P和F等。
发明内容
为了解决上述现有技术中存在的问题,本发明提出了一种基于灰度图像识别易混淆字符的方法,基于原字符的灰度图像,通过找寻字符图像对应的形态轮廓,对形态轮廓进行二次判断来对易混淆字符之间的重新判断纠正,以此降低OCR识别过程对容易混淆字符的识别错误率,减少人工校对矫正的耗时,从而提高OCR识别的效率。
本发明的技术方案如下:
技术方案一:
一种基于灰度图像识别易混淆字符的方法,包括以下步骤:
初步识别;输入原始图像,通过文字识别引擎识别图像中的字符类型,并根据字符类型判断该字符是否属于易混淆字符,所述易混淆字符为字形上存在相似容易误识别的字符;若属于易混淆字符,则进行纠正处理;若不属于,则跳过,保留识别结果,不进行纠正处理;
所述纠正处理包括以下步骤:
获取所述字符图像的像素点梯度;获取该字符的灰度图像,遍历所述灰度图像中各像素点的灰度值,基于每一像素点及其相邻像素点的灰度差值计算各像素点的梯度值;
计算灰度阈值;统计所有像素点的梯度值,选取一个梯度值作为梯度阈值,计算超过该梯度阈值的像素点的灰度平均值作为灰度阈值;
对图像进行二值化;根据所述灰度阈值,将灰度图像中灰度值大于灰度阈值的像素点的置为黑点,将灰度值小于于灰度阈值的像素点的置为白点,生成二值化图像;
字符纠正;根据二值化图像中字符的形态轮廓,获取其二值轮廓图的目标像素点的边缘变化情况,依据该边缘变化情况满足何种字符的形态特征,从而确定该字符类型。
进一步的,所述遍历所述灰度图像中各像素点的灰度值,基于每一像素点及其相邻像素点的灰度差值计算各像素点的梯度值的具体步骤为:
选取待进行纠正处理的目标字符图像中的一像素点作为坐标原点,建立水平直角坐标系;
记所述像素点对应的灰度值为P(x,y);
根据以下公式计算每一像素点的梯度值G:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州符号信息科技有限公司,未经福州符号信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111142126.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序