[发明专利]票据识别方法、装置、设备和存储介质有效
申请号: | 202010274197.3 | 申请日: | 2020-04-09 |
公开(公告)号: | CN111275880B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 徐青松;李青 | 申请(专利权)人: | 杭州睿琪软件有限公司 |
主分类号: | G07D7/20 | 分类号: | G07D7/20;G06K9/32;G06K9/34 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 彭久云;罗莎 |
地址: | 310053 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 识别 方法 装置 设备 存储 介质 | ||
一种票据识别方法、票据识别装置、智能票据识别设备和非瞬时性计算机可读存储介质。票据识别方法包括:获得票据图像;利用区域识别模型识别票据图像,以得到多个字符区域;利用字符识别模型识别多个字符区域,以得到多个字符内容;根据多个字符内容,确定票据的票据信息。根据多个字符内容,确定与待识别的票据对应的票据信息,包括:根据多个字符内容,确定与N个预设关键词对应的N个关键词字符区域;确定与N个关键词字符区域对应的M个候选字符区域;利用评分模型基于在票据图像中N个关键词字符区域和M个候选字符区域的距离和偏离角度进行评分,以确定与N个预设关键词对应的Q个字符内容;根据Q个字符内容,确定票据信息中的目标信息。
技术领域
本公开的实施例涉及一种票据识别方法、票据识别装置、智能票据识别设备和非瞬时性计算机可读存储介质。
背景技术
随着经济的不断发展,人们的消费水平不断的提高,为了维护人们的消费权益,票据成为了消费者的有力保障以及有效的报销凭证,因此财务人员每天需要处理大量的票据,获取票据上的相关信息,如开票时间、开票店铺、付款金额等。另外,也有越来越多的人通过记账分类统计以掌握自身的消费情况,目前人们通常是通过手动记录票据中相关信息的方式进行记账的。因此如何自动识别票据上的相关信息对财务人员以及有记账分类统计的个人来说是十分重要的。
发明内容
本公开至少一个实施例提供一种票据识别方法,包括:获得票据图像,其中,票据图像包括待识别的票据;利用区域识别模型识别票据图像,以得到多个字符区域;利用字符识别模型识别多个字符区域,以得到与多个字符区域对应的多个字符内容;根据多个字符内容,确定与待识别的票据对应的票据信息;其中,票据信息包括目标信息,根据多个字符内容,确定与待识别的票据对应的票据信息,包括:根据多个字符内容,确定多个字符区域中与N个预设关键词对应的N个关键词字符区域;从多个字符区域中确定与N个关键词字符区域对应的M个候选字符区域;利用评分模型基于在票据图像中N个关键词字符区域和M个候选字符区域的距离和偏离角度进行评分,以确定与N个预设关键词对应的Q个字符内容;根据Q个字符内容,确定目标信息,其中,N、M和Q均为正整数。
例如,在本公开一实施例提供的票据识别方法中,N和/或M大于等于2,利用评分模型基于在票据图像中N个关键词字符区域和M个候选字符区域的距离和偏离角度进行评分,以确定与N个预设关键词对应的Q个字符内容,包括:根据N个关键词字符区域和M个候选字符区域,确定多个评分计算组,其中,每个评分计算组表示N个关键词字符区域和M个候选字符区域的一种对应关系;基于N个关键词字符区域和M个候选字符区域的距离和偏离角度,计算多个评分计算组对应的多个评分,并将多个评分中最高评分对应的评分计算组确定为目标评分计算组;根据目标评分计算组表示的N个关键词字符区域和M个候选字符区域的对应关系,确定与N个预设关键词对应的Q个字符内容。
例如,在本公开一实施例提供的票据识别方法中,计算多个评分计算组对应的多个评分包括:对于多个评分计算组中的每个评分计算组,根据该评分计算组中的N个关键词字符区域和N个关键词字符区域对应的候选字符区域的距离和偏离角度,计算得到N个关键词字符区域对应的N个评分,其中,在该评分计算组中,每个关键词字符区域的中心及其对应的候选字符区域的中心之间的连线的距离越大,则每个关键词字符区域对应的评分越小,每个关键词字符区域及其对应的候选字符区域的偏离角度表示每个关键词字符区域的中心及其对应的候选字符区域的中心之间的连线和预设方向之间的夹角,每个关键词字符区域及其对应的候选字符区域的偏离角度越小,则每个关键词字符区域对应的评分越大;对N个评分进行求和以得到该评分计算组对应的评分,从而得到多个评分计算组对应的多个评分。
例如,在本公开一实施例提供的票据识别方法中,从多个字符区域中确定与N个关键词字符区域对应的M个候选字符区域,包括:区域识别模型基于N个预设关键词,确定评分汇总区域;基于评分汇总区域,从多个字符区域中确定M个候选字符区域,其中,M个候选字符区域位于评分汇总区域内。
例如,在本公开一实施例提供的票据识别方法中,目标信息为项目数量且由数字表示,M个候选字符区域每个内的字符内容为数字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州睿琪软件有限公司,未经杭州睿琪软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010274197.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:PCB板的显影方法
- 下一篇:一种基于低压大功率矿用变频器的测试装置