[发明专利]一种文字识别方法、装置及计算机可读存储介质有效
申请号: | 201911177163.6 | 申请日: | 2019-11-26 |
公开(公告)号: | CN111046754B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | 马文伟;刘设伟;沈程秀;闫永泽 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V30/416;G06V30/42;G06V30/148;G06V30/162 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 识别 方法 装置 计算机 可读 存储 介质 | ||
1.一种文字识别方法,其特征在于,所述方法包括:
对待识别的椭圆形印章图像进行二值化处理,得到二值图像;
检测所述二值图像中位于同一条直线上的第一文字序列;
根据所述二值图像中的文字的连线所组成的第一椭圆与所述第一文字序列的位置关系,从所述第一文字序列中确定呈直线型分布的文字序列,包括:
将所述二值图像中的文字进行区域连通,得到多个连通区域;确定所述多个连通区域的中心点,并根据所述中心点的连线确定第一椭圆;若所述第一椭圆与所述第一文字序列存在交叉点,则将位于所述交叉点的文字从所述第一文字序列中去除,得到呈直线型分布的文字序列;若所述第一椭圆与所述第一文字序列不存在交叉点,则将所述第一文字序列确定为呈直线型分布的文字序列;
根据所述二值图像中的第二椭圆的长轴与水平线的夹角将所述第二椭圆设置到水平状态;所述第二椭圆为所述椭圆形印章所对应的椭圆;
分别对所述呈直线型分布的文字序列、呈弯曲型分布的文字序列中的文字进行识别,所述呈弯曲型分布的文字序列包括所述呈直线型分布的文字序列之外的文字。
2.根据权利要求1所述的方法,其特征在于,在分别对所述呈直线型分布的文字序列、所述呈弯曲型分布的文字序列中的文字进行识别之前,还包括:
确定所述呈直线型分布的文字序列的纵坐标,得到第一纵坐标;
确定所述第二椭圆的中心点的纵坐标,得到第二纵坐标;
若所述第一纵坐标大于所述第二纵坐标,则将所述二值图像旋转至所述呈直线型分布的文字序列中的文字处于正立状态。
3.根据权利要求1所述的方法,其特征在于,在对待识别的椭圆形印章图像进行二值化处理之前,还包括:
基于RGB颜色空间,或,基于RGB颜色空间和CMYK颜色空间对待识别的椭圆形印章图像进行图像增强。
4.根据权利要求3所述的方法,其特征在于,所述基于RGB颜色空间对待识别的椭圆形印章图像进行图像增强,包括:
对于所述椭圆形印章图像中的每个像素点,确定所述像素点的R分量、G分量、B分量之间的方差,得到方差矩阵;
基于所述方差矩阵对待识别的椭圆形印章图像进行图像增强。
5.根据权利要求4所述的方法,其特征在于,所述基于RGB颜色空间和CMYK颜色空间对待识别的椭圆形印章图像进行图像增强,包括:
对于所述椭圆形印章图像中的每个像素点,确定所述像素点的R分量与G分量的差值,得到差值矩阵;
在CMYK颜色空间上确定所述椭圆形印章图像的M分量,得到M分量矩阵;
根据所述方差矩阵、所述差值矩阵、所述M分量矩阵确定目标矩阵;
基于所述目标矩阵对待识别的椭圆形印章图像进行图像增强。
6.一种文字识别装置,其特征在于,所述装置包括:
二值化处理模块,用于对待识别的椭圆形印章图像进行二值化处理,得到二值图像;
检测模块,用于检测所述二值图像中位于同一条直线上的第一文字序列;
直线序列确定模块,用于根据所述二值图像中的文字的连线所组成的第一椭圆与所述第一文字序列的位置关系,从所述第一文字序列中确定呈直线型分布的文字序列,包括:
区域连通子模块,用于将所述二值图像中的文字进行区域连通,得到多个连通区域;
中心点确定子模块,用于确定所述多个连通区域的中心点,并根据所述中心点的连线确定第一椭圆;
直线序列确定第一子模块,用于若所述第一椭圆与所述第一文字序列存在交叉点,则将位于所述交叉点的文字从所述第一文字序列中去除,得到呈直线型分布的文字序列;
直线序列确定第二子模块,用于若所述第一椭圆与所述第一文字序列不存在交叉点,则将所述第一文字序列确定为呈直线型分布的文字序列;
水平设置模块,用于根据所述二值图像中的第二椭圆的长轴与水平线的夹角将所述第二椭圆设置到水平状态;所述第二椭圆为所述椭圆形印章所对应的椭圆;
文字识别模块,用于分别对所述呈直线型分布的文字序列、呈弯曲型分布的文字序列中的文字进行识别,所述呈弯曲型分布的文字序列包括所述呈直线型分布的文字序列之外的文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911177163.6/1.html,转载请声明来源钻瓜专利网。