[发明专利]固定版式的卡证图像文字识别方法和装置在审
申请号: | 202210088386.0 | 申请日: | 2022-01-25 |
公开(公告)号: | CN114445843A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 付靖玲;吴大江;曹俊豪;裴积全 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06V30/42 | 分类号: | G06V30/42;G06V30/414;G06V30/146;G06V30/18;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王治东 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 固定 版式 图像 文字 识别 方法 装置 | ||
本发明提供一种固定版式的卡证图像文字识别方法和装置,其中方法包括:获取待识别卡证图像;对所述待识别卡证图像的进行位置定位并对卡证图像的背景进行处理,得到处理后的卡证图像;对所述处理后的卡证图像进行矫正,得到矫正后的卡证图像;对所述矫正后的卡证图像进行分类,得到分类后的卡证图像;对分类后的卡证图像进行文本识别,得到结构化的输出结果。本发明通过对卡证图像进行检测定位,再通过对卡证图像进行矫正,使得在任意角度拍摄的卡证图像在各种变形的情况下都能被定位,同时定位后的卡证图像能够被精确识别,本发明产生的结果能够提高用户的产品体验。
技术领域
本发明涉及图像识别技术领域,尤其涉及一种固定版式的卡证图像文字识别方法和装置。
背景技术
OCR是文字识别的简称,是一种将图片上的光学字符识别出来转换成电子文档的技术。卡证图像OCR需求根据版面的不同分为版面固定的场景和版面不固定的场景,版面固定的场景是指需要识别内容的在目标上的位置是固定的,例如驾驶证上面的文本行在驾驶证上的位置是固定的,证号一定在“机动车驾驶证”这几个字的下方;版面不固定的场景是指需要识别的内容在目标上的位置是不固定的,例如银行卡上的卡号在银行卡上的位置有可能在正面、也有可能在背面,可能竖着也可能横着。
基于传统机器学习的版式固定的卡证OCR技术可扩展性差,因为所有操作都是基于固定的规则和阈值做的,不同光照、不同环境采集的样本差别较大,而且不同的人拍照的习惯也不一样,一套规则和阈值很难适应所有的场景,这就导致识别准确率低。
基于神经网络的文字检测+基于神经网络的文字识别的版式固定的卡证图像文字识别方案的确定在于容易受背景的干扰,如果背景上有文字,会导致正则化失败;其次,用户采集照片时拍照的角度是随机的,这会导致文本行检测算法检测不准确,进而导致识别不准确,最后的结果是识别精度低。
以上两种方案有些厂家也有解决方案,通过SDK采集数据,限制用户拍照时采集数据的方式,要求客户必须把需要识别的目标正放,且不能有旋转角度,也不能采集到过多的背景。这就导致OCR产品的用户体验非常差。
发明内容
本发明提供一种固定版式的卡证图像文字识别方法和装置,用以解决现有技术中识别精度低导致用户体验差的缺陷,实现支持任何角度拍照的固定版式文字识别,并提高固定版式的文字识别的精度,提高用户体验。
第一方面,本发明提供一种固定版式的卡证图像文字识别方法,包括:
获取待识别卡证图像;
对所述待识别卡证图像的进行位置定位并对卡证图像的背景进行处理,得到处理后的卡证图像;
对所述处理后的卡证图像进行矫正,得到矫正后的卡证图像;
对所述矫正后的卡证图像进行分类,得到分类后的卡证图像;
对分类后的卡证图像进行文本识别,得到结构化的输出结果。
根据本发明提供一种的固定版式的卡证图像文字识别方法,其中,所述对所述待识别卡证图像的进行位置定位并对卡证图像的背景进行处理,得到处理后的卡证图像,具体包括:
获取用于识别所述待识别卡证图像的第一角点,其中第一角点的为四个角点;
依据所述第一角点勾画出卡证图像的轮廓;
将确定所述轮廓的卡证图像的外部区域予以消除处理,得到处理后的卡证图像。
根据本发明提供一种的固定版式的卡证图像文字识别方法,其中,所述对所述处理后的卡证图像进行矫正,得到矫正后的卡证图像,具体包括:
获取所述处理后的卡证图像上的第二角点和所述卡证图像每条边上的至少一个点作为关键点;
依据所述关键点确定卡证图像的边线;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210088386.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序