[发明专利]一种基于OCR识别的采集发票数据的系统及方法在审
申请号: | 202011610332.3 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112699873A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 花晗;吴红梅;庞博;谢晖;李少维;张飚 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/38;G06F21/60;G06F16/583;G06F40/194;G06Q40/00 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 刘海蓉 |
地址: | 100195 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ocr 识别 采集 发票 数据 系统 方法 | ||
本发明公开了一种基于OCR识别的采集发票数据的系统及方法,属于数据采集及处理技术领域。本发明系统包括:添加模块,所述添加模块针对不同发票种类,以多种发票添加方式,获取待采集发票的发票影像数据;识别模块,获取发票要素;查验模块,所述查验模块调用所述识别模块识别的发票要素,以发票要素作为查询数据,请求税务查询系统对查询数据进行查询,获取查验结果和发票信息;校验模块,将待采集的发票添加至目标系统,完成对待采集的发票的采集。本发明避免了发票票面信息与二维码包含信息不一致的虚假发票数据被采集,进而导致的税务问题。
技术领域
本发明涉及数据采集及处理技术领域,并且更具体地,涉及一种基于OCR识别的采集发票数据的系统及方法。
背景技术
电子发票成为了“互联网+税务”环境下的产物,它作为信息时代的产物,依托互联网,为财税工作带来了巨大的冲击和影响,现行的电子发票视同纸票使用,企业员工在报销时常出现抱怨发票数据填写繁琐、发票收集渠道多难以完成、发票还需查验打印、报销单数据填写错误等情况,由此衍生出一系列发票采集软件。
公知的发票采集软件,虽然能采集发票数据,但是存在多种问题:针对增值税普通发票、专用发票软件居多,但同一个报销单中需要报销的火车票、飞机行程单、出租车发票等报销常用发票无法采集;发票识别时,仅解析发票二维码中包含的发票代码、号码、金额等数据,未确认票面信息与二维码解析信息是否一致,这样可能导致发票票面信息与二维码包含信息不一致的虚假发票数据被采集至系统中。扫码添加或手动添加等方式虽能将发票数据添加至系统中,但财务审核发票时需查看版式文件或纸质发票,无法达到审核的效果。
发明内容
针对上述问题,本发明提出了一种基于OCR识别的采集发票数据的系统,包括:
添加模块,所述添加模块针对不同发票种类,以多种发票添加方式,获取待采集发票的发票影像数据;
识别模块,所述识别模块调用所述添加模块获取的发票影像数据,将发票影像数据与发票影像数据的票种信息加密传输至识别模块的票据识别接口,对加密后的发票影像数据与发票影像数据的票种信息进行二值化处理,并使用预设函数确定连接的文本组,同时解析发票影像数据中的二维码信息,获取发票要素;
查验模块,所述查验模块调用所述识别模块识别的发票要素,以发票要素作为查询数据,请求税务查询系统对查询数据进行查询,获取查验结果和发票信息;
校验模块,所述校验模块接收所述查验模块获取的查验结果和发票信息,对查验结果及发票信息进行比对,若对比信息一致,将待采集的发票添加至目标系统,完成对待采集的发票的采集。
可选的,系统还包括,修改模块,所述修改模块用于在票据识别接口识别失败后,输入待修改的数据项,完成对待采集的发票的采集。
可选的,多种添加方式,包括:拍照添加,信息添加和上传添加。
可选的,查验模块,调用的发票要素对应的发票为非增值税管理新系统的发票时,在税务查询系统获取的查询结果即为比对后的结果,根据查询结果确定待采集的发票是否添加至目标系统。
可选的,上传添加及短信添加,是针对电子发票的添加方式。
本发明还提出了一种基于OCR识别的采集发票数据的方法,包括:
针对不同发票种类,以多种发票添加方式,获取待采集发票的发票影像数据;
将发票影像数据与发票影像数据的票种信息加密传输至识别模块的票据识别接口,对加密后的发票影像数据与发票影像数据的票种信息进行二值化处理,并使用预设函数确定连接的文本组,同时解析发票影像数据中的二维码信息,获取发票要素;
以发票要素作为查询数据,请求税务查询系统对查询数据进行查询,获取查验结果和发票信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011610332.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于批量文档增量的分类系统及方法
- 下一篇:一种发电机双燃料联动装置