[发明专利]用于对文档图像进行一致性比对的方法及装置在审
申请号: | 202210643781.0 | 申请日: | 2022-06-08 |
公开(公告)号: | CN114937280A | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 罗涛;张晓博;钱烽 | 申请(专利权)人: | 蚂蚁区块链科技(上海)有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/418;G06V30/18;G06V30/19 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉;刘景峰 |
地址: | 200010 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 文档 图像 进行 一致性 方法 装置 | ||
本说明书实施例提供了用于对文档图像进行一致性比对的方法及装置。在该方法中,获取待比对文档图像;使用文本特征提取模型对待比对文档图像进行特征提取,以得到对应的待比对文本特征向量;根据待比对文本特征向量以及文档库中的各个文档图像对应的文本特征向量,从文档库中确定出与待比对文档图像的相似度最高的第一指定数量的文档图像;以及将待比对文档图像与所确定出的各个文档图像分别进行相似性比对,以确定出与待比对文档图像中的文本内容一致的文档图像。
技术领域
本说明书实施例涉及人工智能技术领域,具体地,涉及用于对文档图像进行一致性比对的方法及装置。
背景技术
文档由字符、句子、段落等不同类型的文本构成,两个文档之间进行一致性比对时,是针对两个文档中的文本进行比对。当两个文档中的文本存在差异时,则该两个文档之间不一致。否则,该两个文档之间具备一致性。
目前,针对文档的一致性比对,常用比对方式是利用OCR(Optical CharacterRecognition,光学字符识别)技术进行比对。在该比对方式中,对于待比对的任意两个文档,需要先将该两个文档转换成图像,然后利用OCR技术分别对每个文档的图像进行字符识别,以识别出每个文档中包含的字符。接着,将两个文档中所识别出的字符进行一一比对,当经过比对存在不同的字符时,可以确定该两个文档不一致。当经过比对两个文档中的字符均相同时,则可以确定该两个文档具备一致性。通过OCR技术,能够实现对任意两个文档之间的一致性比对。
发明内容
鉴于上述,本说明书实施例提供了用于对文档图像进行一致性比对的方法及装置。在本说明书实施例提供的技术方案中,通过根据文本特征向量的相似性能够从文档库中粗筛出一部分相似度较高的文档图像,从而减少了与待比对文档图像进行比对处理的文档图像的数量,提高了一致性比对的处理效率。此外,通过多任务学习方式训练出的文本特征提取模型能够提取更有效的且更有针对性的语义特征信息,从而在初筛阶段针对相似的文档图像的筛选更精确。
根据本说明书实施例的一个方面,提供了一种用于对文档图像进行一致性比对的方法,包括:获取待比对文档图像;使用文本特征提取模型对所述待比对文档图像进行特征提取,以得到对应的待比对文本特征向量,其中,所述文本特征提取模型是通过多任务学习方式训练得到,所述训练中的多任务包括针对图像文本的不同维度的任务;根据所述待比对文本特征向量以及文档库中的各个文档图像对应的文本特征向量,从所述文档库中筛选出与所述待比对文档图像的相似度最高的第一指定数量的文档图像,其中,所述各个文档图像对应的文本特征向量是使用所述文本特征提取模型得到的;以及将所述待比对文档图像与所筛选出的各个文档图像分别进行相似性比对,以确定出与所述待比对文档图像中的文本内容一致的文档图像。
根据本说明书实施例的另一方面,还提供一种用于对文档图像进行一致性比对的装置,包括:文档图像获取单元,获取待比对文档图像;特征向量提取单元,使用文本特征提取模型对所述待比对文档图像进行特征提取,以得到对应的待比对文本特征向量,其中,所述文本特征提取模型是通过多任务学习方式训练得到,所述训练中的多任务包括针对图像文本的不同维度的任务;文档图像筛选单元,根据所述待比对文本特征向量以及文档库中的各个文档图像对应的文本特征向量,从所述文档库中筛选出与所述待比对文档图像的相似度最高的第一指定数量的文档图像,其中,所述各个文档图像对应的文本特征向量是使用所述文本特征提取模型得到的;以及相似性比对单元,将所述待比对文档图像与所筛选出的各个文档图像分别进行相似性比对,以确定出与所述待比对文档图像中的文本内容一致的文档图像。
根据本说明书实施例的另一方面,还提供一种电子设备,包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器上的计算机程序,所述至少一个处理器执行所述计算机程序来实现如上述任一所述的用于对文档图像进行一致性比对的方法。
根据本说明书实施例的另一方面,还提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的用于对文档图像进行一致性比对的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蚂蚁区块链科技(上海)有限公司,未经蚂蚁区块链科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210643781.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序