[发明专利]一种增值税普通发票智能识别与校验系统及其方法有效
申请号: | 202011119283.3 | 申请日: | 2020-10-19 |
公开(公告)号: | CN112651289B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 王漳;梁祖红 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V20/62;G06V10/774;G06V10/82;G06N3/0464;G06T3/00;G06T7/13;G06T7/70;G06K7/14 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 孔祥健 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 增值税 普通发票 智能 识别 校验 系统 及其 方法 | ||
1.一种增值税普通发票智能识别与校验系统,其特征在于,包括顺序连接的图像采集模块(1)、图像预处理模块(2)、二维码解码模块(3)、文本区域定位模块(4)、文本检测识别模块(5)、校验模块(6)以及结果输出模块(7);
其中,所述图像采集模块(1),用于扫描单张票据,将单张票据转换为计算机数字图像数据;
所述图像预处理模块(2),用于利用增值税普通发票与底座之间形成的色差边界,使用霍夫变换检测出边界直线的倾斜度,通过仿射变换完成发票的水平校正,再对校正后的图像进行边缘检测,完成增值税普通发票图像的提取;
所述二维码解码模块(3),用于对增值税普通发票图像进行二维码扫描解码;
所述文本区域定位模块(4),用于对文本区域一和文本区域二进行定位;
所述文本检测识别模块(5),用于进行端对端的文本区域检测及识别;
所述校验模块(6),用于对识别出的内容进行校验;
所述结果输出模块(7),用于将识别后的各个字段的结果整理,以面向对象编程的思想,将票据的内容发送、保存在数据库中,实现数据的持久化,方便了财务人员后期的管理与查询。
2.一种用于权利要求1所述的增值税普通发票智能识别与校验系统的方法,其特征在于,包括以下步骤:
S1、通过图像采集模块扫描单张票据,将单张票据转换为计算机数字图像数据;
S2、通过图像预处理模块对计算机数字图像数据进行预处理,完成增值税普通发票图像的提取;
S3、通过二维码解码模块对增值税普通发票图像进行二维码扫描解码;
S4、对于增值税普通发票图像中需要提取的文本区域,划分为两个区域;文本区域一为:表格框中的内容信息;文本区域二为:表格框右上角的发票代码、发票号码、开票日期和校验码区域;通过文本区域定位模块对文本区域一和文本区域二进行定位;
S5、通过文本检测识别模块进行端对端的文本区域检测及识别;
S6、通过校验模块识别出的内容进行校验;
S7、结果输出模块将识别后的各个字段的结果整理,以面向对象编程的思想,将票据的内容发送、保存在数据库中,实现数据的持久化,方便了财务人员后期的管理与查询。
3.根据权利要求2所述的一种用于增值税普通发票智能识别与校验系统的方法,其特征在于,所述步骤S2的具体过程为:
利用增值税普通发票与底座之间形成的色差边界,使用霍夫变换检测出边界直线的倾斜度,通过仿射变换完成发票的水平校正,再对校正后的图像进行边缘检测,从而完成发票图像的提取。
4.根据权利要求2所述的一种用于增值税普通发票智能识别与校验系统的方法,其特征在于,所述步骤S3扫描二维码过程中,采用三次识别算法进行二维码识别,具体包括:
首先对原图进行识别,如果原图识别失败,对图像进行OTSU算法再识别,如果阈值OTSU失败,则对图像进行限制对比度的自适应直方图均衡化处理。
5.根据权利要求2所述的一种用于增值税普通发票智能识别与校验系统的方法,其特征在于,所述步骤S4中,对于文本区域一的定位,采用边缘检测和角点检测将整个信息框提取出来,而整个信息框中小框的位置信息则采用等比例切割的方法初步获取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011119283.3/1.html,转载请声明来源钻瓜专利网。