[发明专利]电子装置、票据识别方法及存储介质在审
申请号: | 201811260786.5 | 申请日: | 2018-10-26 |
公开(公告)号: | CN109635633A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 郑佳 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 单框 特征向量 相似度 标准向量 存储介质 电子装置 票据表格 票据识别 图片 工作效率 票据图像 人力成本 数据分析 预先确定 直线检测 预设 | ||
本发明涉及数据分析识别,提出了一种票据识别方法,该方法包括:对待识别的票据图片中的表单进行直线检测,获取票据图片中的各个表单框线和各个表单框线之间的位置关系;根据各个表单框线和各个表单框线之间的位置关系,计算出所述票据图片的特征向量;计算所述表格的特征向量与预先确定的各类型票据表格的标准向量之间的相似度,若有某类型票据表格的标准向量与所述表格的特征向量之间的相似度小于或等于预设的相似度阈值,则确定待识别的票据图片为该类型票据。能够准确识别出票据图像的类型,节省人力成本,提高工作效率。本发明还提出一种电子装置及存储介质。
技术领域
本发明涉及票据识别领域,尤其涉及一种电子装置、票据识别方法及存储介质。
背景技术
如今随着金融行业的快速发展,金融业务涉及到的图片数量以及种类也越来越多。而对于涉及到的票据图片,通常需要在一定的时间段内进行统计并作为催款、报销等业务的依据,这就需要对票据图片进行分类别管理,以方便相关业务的顺利进行。然而,目前对于票据图片的分类仍需借助大量的人力进行,分类处理的效率低下,且容易出现错误。
因此,如何提出一种高效、准确地自动识别出票据图片的类型,成为亟待解决的问题。
发明内容
有鉴于此,本发明提出一种电子装置、票据识别方法及存储介质,能够准确识别出票据图像的类型,节省人力成本,提高工作效率。
首先,为实现上述目的,本发明提出一种电子装置,所述电子装置包括存储器、及与所述存储器连接的处理器,所述处理器用于执行所述存储器上存储的票据识别程序,所述票据识别程序被所述处理器执行时实现如下步骤:
A1、对待识别的票据图片中的表单进行直线检测,获取票据图片中的各个表单框线和各个表单框线之间的位置关系;
A2、根据各个表单框线和各个表单框线之间的位置关系,计算出所述票据图片的特征向量;
A3、计算所述表格的特征向量与预先确定的各类型票据表格的标准向量之间的相似度,若有某类型票据表格的标准向量与所述表格的特征向量之间的相似度小于或等于预设的相似度阈值,则确定待识别的票据图片为该类型票据。
优选地,所述步骤A2包括:
根据各个表单框线和各个表单框线之间的位置关系,提取表单框线的各个交叉点,获取各个交叉点的信息,以及,获取各个表单框线中水平方向表单框线的信息、和垂直方向表单框线的信息;
根据各个交叉点的信息、水平方向表单框线的信息和垂直方向表单框线的信息,识别出所述票据图片中的表格;
对识别出的表格的所有交点进行位置标记,并根据预先确定的排序规则将所述位置标记进行排序,生成位置序列;
分别计算各个交点与所述位置序列中的预定义的位置点之间的像素距离,将计算得到的各个像素距离进行归一化处理,得到所述表格的特征向量。
优选地,所述票据识别程序被所述处理器执行时还实现如下步骤:
若确定出待识别的票据图片对应的票据类型包含多个子类型,则根据预先训练完成的分类器对该票据类型进行识别,以识别出待识别的票据图片对应的子类型。
优选地,所述预先训练完成的分类器的训练过程包括:
构造该票据类型的结构型Haar特征并与基本Haar特征组成新增特征库,并利用该特征库提取样本特征值;
采用Adaboost算法训练分类器,提取自适应分类阈值,得到最佳弱分类器;
多次迭代训练多个弱分类器,加权平均成强分类器;
训练多个强分类器,组成级联分类器,所述级联分类器为训练完成的分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811260786.5/2.html,转载请声明来源钻瓜专利网。