[发明专利]文字识别的方法、装置、设备和计算机可读介质在审
申请号: | 202010789024.5 | 申请日: | 2020-08-07 |
公开(公告)号: | CN113780267A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 魏雪;何云龙;赖荣凤;梅涛 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 郭晗;赵迪 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 识别 方法 装置 设备 计算机 可读 介质 | ||
本发明公开了文字识别的方法、装置、设备和计算机可读介质,涉及计算机技术领域。该方法的一具体实施方式包括:利用待识别图像的模板图像,校正所述待识别图像,获得校正图像;采用文字识别模型识别所述校正图像中的字符串,定位所述校正图像中字符串的位置,以及获知所述校正图像中字符串的文字;基于所述模板图像中的识别区域,所述校正图像中字符串的位置和所述校正图像中字符串的文字,确定所述校正图像的识别结果,所述识别结果包括所述模板图像的识别区域的项目和所述校正图像在所述识别区域的文字。该实施方式能够提高不同证件或票据中的文字识别效率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种文字识别的方法、装置、设备和计算机可读介质。
背景技术
证件或票据识别具有广泛的应用场景,包括身份认证系统,财务报销系统,以及信息录入系统等。一种识别模型只能识别一种特定证件或票据,如:身份证识别,驾驶证识别或增值税专用发票识别等。
为了获得性能较好的识别模型,首先需要收集大量特定图像,并标注其中的关键字符串;然后利用所标注的图像训练识别模型,识别模型输出图像中关键字符串的识别结果。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:对于新增识别需求无法复用已有识别模型,需要重新收集并标注大量图像建立识别模型,因此存在不同证件或票据中的文字识别效率较低的技术问题。
发明内容
有鉴于此,本发明实施例提供一种文字识别的方法、装置、设备和计算机可读介质,能够提高不同证件或票据中的文字识别效率。
为实现上述目的,根据本发明实施例的一个方面,提供了一种文字识别的方法,包括:
利用待识别图像的模板图像,校正所述待识别图像,获得校正图像;
采用文字识别模型识别所述校正图像中的字符串,定位所述校正图像中字符串的位置,以及获知所述校正图像中字符串的文字;
基于所述模板图像中的识别区域,所述校正图像中字符串的位置和所述校正图像中字符串的文字,确定所述校正图像的识别结果,所述识别结果包括所述模板图像的识别区域的项目和所述校正图像在所述识别区域的文字。
所述利用待识别图像的模板图像,校正所述待识别图像,获得校正图像,包括:
将所述待识别图像中的字符串与所述模板图像中的锚点字符串进行匹配,以得到所述待识别图像中与所述模板图像中的锚点字符串的编辑距离最小的目标字符串;
利用所述锚点字符串与所述目标字符串之间的位置关系,校正所述待识别图像,获得校正图像。
所述待识别图像中的字符串是利用文字识别模型识别所述待识别图像得到的。
所述利用所述锚点字符串与所述目标字符串之间的位置关系,校正所述待识别图像,获得校正图像,包括:
根据所述锚点字符串与所述目标字符串之间的位置关系,建立仿射变换矩阵;
根据所述仿射变换矩阵,将所述待识别图像变换为所述校正图像。
所述锚点字符串的数量为4个或4个以上。
所述基于所述模板图像中的识别区域,所述校正图像中字符串的位置和所述校正图像中字符串的文字,确定所述校正图像的识别结果,所述识别结果包括所述模板图像的识别区域的项目和所述校正图像在所述识别区域的文字,包括:
基于所述模板图像中的识别区域,和所述校正图像中字段字符串所在区域,得到所述校正图像中字段字符串的交并比,所述校正图像中字段字符串所在区域由所述字段字符串的位置确定;
按照所述校正图像中字段字符串的交并比,确定所述校正图像的识别区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010789024.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:小程序灰度发布方法和装置
- 下一篇:一种分数型分频比锁相环