[发明专利]一种票据识别方法及装置有效
申请号: | 202010873968.0 | 申请日: | 2020-08-26 |
公开(公告)号: | CN111931687B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 邓练兵;宋宇轩;方文佳 | 申请(专利权)人: | 珠海大横琴科技发展有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 胡晓静 |
地址: | 519000 广东省珠海市横琴新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 票据 识别 方法 装置 | ||
本申请提供一种票据识别方法及装置,该方法包括:获取待处理图像;其中,待处理图像中包括票据图像,票据图像中包括多个票据元素;根据预设的票据元素样本集合和待处理图像对应的字符识别信息,确定票据图像中的至少一个第一票据元素的识别结果;根据第一票据元素的识别结果中的位置特征,确定与第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域;根据目标区域对应的字符识别信息,确定第二票据元素的识别结果;根据第一票据元素的识别结果和至少一个第二票据元素的识别结果,生成票据识别结果。无需为不同票据类型的票据分别创建票据识别框架,具有较高的适应性。
技术领域
本发明涉及自动化办公领域,具体涉及一种票据识别方法及装置。
背景技术
随着移动互联网技术的发展,办公智能化正在被广泛应用,其中,票据涉及到社会生活的各个领域,对于票据的智能识别和处理已成为目前研究的重点。
在现有技术中,通常是利用光学字符识别(Optical Character Recognition,简称:OCR)技术,对待处理票据对应的票据图像中的文字信息进行提取,并根据预设的票据识别框架,确定各文字信息对应的票据位置,对已获得的文字信息进行分类。
但是,由于一些大型银行经营范围较广,在办理业务过程中,会产生种类繁多的票据。票据种类存在多样化,现有技术中的票据识别方法的适应性较差,无法灵活应用于各种类型的票据。因此,急需一种能够满足多种应用场景的票据识别方法,对提高票据识别效率具有重要意义。
发明内容
因此,本发明要解决的技术问题在于现有技术中的票据识别方法存在适应性较差的缺陷,从而提供一种票据识别方法及装置。
本申请第一个方面提供一种票据识别方法,包括:
获取待处理图像;其中,所述待处理图像中包括票据图像,所述票据图像中包括多个票据元素;
根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息,确定所述票据图像中的至少一个第一票据元素的识别结果;其中,所述识别结果包括所述第一票据元素对应的元素类型、语义信息和位置特征;
根据所述第一票据元素的识别结果中的位置特征,确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域;
根据所述目标区域对应的字符识别信息,确定所述第二票据元素的识别结果;
根据所述第一票据元素的识别结果和至少一个第二票据元素的识别结果,生成票据识别结果。
可选的,所述根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息,确定所述票据图像中的至少一个第一票据元素的识别结果,包括:
计算所述字符识别信息中的各字段与所述票据元素样本集合中各样本的相似度,根据所述相似度从大到小的排序结果,确定第一目标样本和所述第一目标样本对应的第一票据元素;
根据所述第一目标样本对应的元素类型,确定所述第一票据元素的元素类型;
根据所述第一目标样本对应的位置特征,确定所述第一票据元素的位置特征;
根据所述字符识别信息,确定所述第一票据元素的语义信息。
可选的,所述根据所述第一票据元素的识别结果中的位置特征,确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域,包括:
在所述票据元素样本集合中,确定至少一个与所述第一目标样本存在位置关联关系的第二目标样本;根据所述第二目标样本对应的位置特征,确定所述第二票据元素对应的目标区域。
可选的,所述根据所述目标区域对应的字符识别信息,确定所述第二票据元素的识别结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海大横琴科技发展有限公司,未经珠海大横琴科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010873968.0/2.html,转载请声明来源钻瓜专利网。