[发明专利]一种文字图像识别纠错方法和电子设备有效
申请号: | 202210316087.8 | 申请日: | 2022-03-29 |
公开(公告)号: | CN114677689B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 宋祺;张睿;燕鹏举;周健 | 申请(专利权)人: | 上海弘玑信息技术有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06F40/216;G06F40/232 |
代理公司: | 江苏瑞途律师事务所 32346 | 代理人: | 计璐 |
地址: | 200000 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 图像 识别 纠错 方法 电子设备 | ||
本发明公开一种文字图像识别纠错方法和电子设备,属于计算机视觉和自然语言处理技术领域。针对现有技术中存在的文字图像识别准确率不够,构建模型需要成本较高的问题,本发明对文字图像识别后的潜在错误结果构建候选替换集合,基于语言模型替换潜在错误结果,对替换后的每个文字序列计算合理性得分,根据得分排序,输出得分合理性得分最高的文字序列作为纠错后输出结果。本发明基于语言模型进行文字图像识别的纠错,提高文字图像识别的准确性,且成本低耗费时间少,不受模块中其他单元限制,通用性强,适合广泛应用。
技术领域
本发明涉及计算机视觉和自然语言处理技术领域,更具体地说,涉及一种文字图像识别纠错方法和电子设备。
背景技术
文字图像,即包括文字信息的图像。目前,识别图像中的文字作为计算机视觉中的一种常用技术,被广泛应用于文档信息提取、证照识别、资质审核等实际项目中,特别是在RPA (Robotic Process Automation,机器人流程自动化)项目中有着普遍应用。在研发过程中,文字图像识别算法通常使用海量数据训练,得到一个在测试集上效果比较理想的模型。但在某些实际使用场景,往往会出现测试集中没有出现的数据,文字图像识别算法的准确率会因此打折。
识别图像中文字时,由于图像中文字大小、形状、颜色等表达的多样性,往往会产生错误的识别结果,因此现文字图像识别中均包括纠错步骤。现有技术的纠错方式主要是在训练文字识别模型阶段进行优化,如收集更多的实际使用场景数据加入到模型训练,或为一些非常重要的场景单独训练一个文字图像识别模型,用于克服识别过程中的纠错,但是,现有技术尚有以下不足:
1、某些场景的数据比较难收集,例如医疗、金融和保险等领域的相关文档,由于用户隐私问题,无法将所有的数据均公开给乙方作为训练数据;
2、标注文字识别数据需要消耗大量资金和时间;一般来说,标注二十万的数据大约需要十万元,耗时至少两个月,而一个效果较好的文字图像识别模型通常需要千万量级的数据;
3、文字图像识别模型的迭代需要耗费大量的人力、算力和时间;一般来说,利用千万数据量级训练一个文字图像识别模型通常需要一周左右的时间;
4、单独训练一个文字图像识别模型用于某些特殊场景缺乏普适性,文字图像识别的实际应用场景存在成千上万个,但由于人力、算力和时间限制,为每个场景单独训练一个模型基本没有可行性。
发明内容
1.要解决的技术问题
针对现有技术中存在的文字图像识别准确率不够,构建模型需要成本较高的问题,本发明提供一种文字图像识别纠错方法和电子设备,基于语言模型进行文字图像识别的纠错,提高文字图像识别的准确性,且成本低,耗费时间少,应用时不受模块中其他单元限制,通用性强,适合广泛应用。
2.技术方案
本发明的目的通过以下技术方案实现。
第一方面,本发明提供一种文字图像识别纠错方法,包括以下步骤:
对文字图像进行文字识别,预处理文字识别结果,过滤出所述文字识别结果的潜在错误结果;
构建候选替换集合;候选替换集合可以是包括所有汉字的集合,或者1000个常用汉字的集合,或者是GBK/2、GBK/3汉字编码集合,GBK/2汉字编码集合收录6763个汉字,GBK/3 汉字编码集合收录6080个汉字;
基于语言模型,用所述候选替换集合中的文字逐一替换所述潜在错误结果,并计算每次潜在错误结果替换后文字序列的合理性得分;
将所有合理性得分排序,输出合理性得分最高的文字序列作为纠错后输出结果。
更进一步的,对于包括多个所述潜在错误结果的文字识别结果,结合所有所述潜在错误结果替换后的文字序列计算合理性得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海弘玑信息技术有限公司,未经上海弘玑信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210316087.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序