[发明专利]一种票据分类识别方法及系统在审
申请号: | 201910577143.1 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110348346A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 郭近之;王宇;赵娟;陆俊龙;徐伟豪 | 申请(专利权)人: | 苏宁云计算有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06Q40/00 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 许峰 |
地址: | 210042 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 文字识别 图片 票据分类 票据识别 封装 分类效率 文字内容 业务使用 自动分类 分类 分拣 财务 分割 审核 | ||
本发明实施例公开了一种票据分类识别方法及系统,包括:获取含有票据的图片,对图片中的票据进行识别分类,获得票据识别结果,票据识别结果包括N张单张票据图片;对N张单张票据图片进行文字识别,获得文字识别结果;将文字识别结果封装成专项模型。通过将含有票据的图片进行分类分割,形成多张单张票据图片,再分别对单张票据图片进行文字识别,识别出票据上的文字内容及票据所属的类型,由此可以将同一张报销单上的多张且不同类型的票据进行自动分类识别,提高了分类效率,简化了财务人员的票据分拣工作;并分别将单张票据图片的文字识别结果封装成各票据对应的专项模型,以供其它业务使用,为后续审核提供方便。
技术领域
本发明属于电子办公技术领域,尤其涉及一种票据分类识别方法及系统。
背景技术
目前财务共享办公领域发票报销,扫描,审核大多仍采取人工审核方式,财务人员每天都面临着实物票接受,分拣,扫描,审核,批复的过程。整个流程线枯燥乏味,存在着大量重复手工操作,尤其是票据审核,需要反复对比员工提报的报销流程信息与票面信息是否一致,费时费力。
发明内容
本发明的实施例提供一种票据分类识别方法及系统,能够自动识别分类一张报销单上的多种类型的票据,提高了识别效率,简化了财务人员的分拣工作。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明的实施例提供一种票据分类识别方法,包括:
S10获取含有票据的图片,对所述图片中的票据进行识别分类,获得票据识别结果,所述图片包括N张票据,N为大于1的整数,所述票据识别结果包括N张单张票据图片;
S20对所述N张单张票据图片进行文字识别,获得文字识别结果;
S30将所述文字识别结果封装成专项模型。
结合第一方面,在第一方面的第一种可能的实现方式中,所述步骤S10使用OCR识别技术对所述图片中的票据进行识别分类,具体包括:
S101将所述图片的大小调整设定值;
S102在所述调整后的图片上运行单个卷积网络;
S103由OCR识别技术中的目标检测模型的置信度对S102获得的图片运行卷积结果进行阈值处理;
S104利用神经网络做图像语义分割,获得N张单张票据图片。
结合第一方面,在第一方面的第二种可能的实现方式中,所述步骤S20中使用OCR识别技术对N张单张票据图片进行文字识别,获得文字识别结果,所述文字识别结果包括所述单张票据图片上的文字以及所述文字位于所述单张票据图片上的坐标。
结合第一方面,在第一方面的第三种可能的实现方式中,所述步骤S30具体包括:
S301根据所属文字识别结果,得到所述单张票据图片上的票据所属的类型;
S302根据所述票据所属的类型,将文字识别结果封装成所述票据的专项模型,所述专项模型包括至少一个业务字段;
S303将所述一个或多个业务字段约定为所述专项模型的目标字段。
第二方面,本发明的实施例提供一种票据分类识别系统,包括:
票据识别模块,用于获取含有票据的图片,对所述图片中的票据进行识别分类,获得票据识别结果,所述图片包括N张票据,N为大于1的整数,所述票据识别结果包括N张单张票据图片;
文字识别模块,用于对所述N张单张票据图片进行文字识别,获得文字识别结果。
封装模块,用于将所述文字识别结果封装成专项模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁云计算有限公司,未经苏宁云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910577143.1/2.html,转载请声明来源钻瓜专利网。