[发明专利]一种基于深度学习的发票批量自动识别系统有效
申请号: | 201811285202.X | 申请日: | 2018-10-31 |
公开(公告)号: | CN109657665B | 公开(公告)日: | 2023-01-20 |
发明(设计)人: | 江熠铧;张学习;吴观河;孙志平;方博楷;张扬;罗健炜 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06V30/10 | 分类号: | G06V30/10;G06V30/18;G06N3/0464;G06N3/08;G07D7/202 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杨晓松 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 发票 批量 自动识别 系统 | ||
本发明公开了一种基于深度学习的发票批量自动识别系统,包括:发票图像获取模块,用于获取发票的扫描图并进行格式转换,得到发票图像进行保存;然后对发票图像进行摆正处理和归一化处理;预处理与定位模块,用于对归一化后的发票图像进行倾斜校正和数字区域定位;字符切割模块,用于对所述的数字区域中的字符进行切割,得到切割后的字符图像;字符识别模块,用于通过CNN卷积神经网络对切割后的字符图像进行字符识别;输出模块,用于将识别出的字符记录到Excel表格的对应位置,并对字符进行准确性判定与人工更正。本发明能快速、高效地完成发票上主要信息的识别,克服了以往只能靠人工对发票进行管理而存在的速度慢、效率低、出错率高的问题。
技术领域
本发明涉及信息技术领域,具体涉及一种基于深度学习的发票批量自动识别系统。
背景技术
发票是日常生活中经常使用的一种凭据,如商业机构、政府机构、医疗机构、公安机构等都需要开具大量的发票。如今互联网技术发展迅猛,线上支付大量普及,随即也出现了相对应的电子发票,但电子发票还是有些弊端,如由于消费者自行打印的电子发票纸质以及打印效果都有差异,容易导致防伪性能消失,或者由于电子发票可以重复打印导致重复报销的风险增大,所以目前传统纸质发票还是广为使用。
发票主要是公司做账的依据,同时也是缴税的费用凭证,因此通常需要财务部门进行发票的管理工作。然而发票管理工作繁琐且乏味,其工作量大、需记录数据多,人为记录需要消耗大量的人力物力。随着技术的发展,现采用图像识别技术,可以快速,准确地提取发票的信息。从而大大减少发票处理时间,节省人力物力,且提高发票信息记录的准确率。
发明内容
本发明的目的是提供一种基于深度学习的发票批量自动识别系统,用以解决传统人工对发票管理记录存在的速度慢、效率低、出错率高的问题。
为了实现上述任务,本发明采用以下技术方案:
一种基于深度学习的发票批量自动识别系统,包括:
发票图像获取模块,用于获取发票的扫描图并进行格式转换,得到发票图像进行保存;然后对发票图像进行摆正处理和归一化处理;
预处理与定位模块,用于对归一化后的发票图像进行倾斜校正和数字区域定位;
字符切割模块,用于对所述的数字区域中的字符进行切割,得到切割后的字符图像;
字符识别模块,用于通过CNN卷积神经网络对切割后的字符图像进行字符识别;
输出模块,用于将识别出的字符记录到Excel表格的对应位置,并对字符进行准确性判定与人工更正。
进一步地,所述的对发票图像进行摆正处理和归一化处理,包括:
利用openCV的最小轮廓定位与仿射变换方法,得到摆正后的发票图像;
所述的归一化处理为:
检测发票图像的长度L、宽度R,计算长宽比例K=L/R;
若比例K1.75,表示发票图像所对应的发票正常,将发票图像归一化至1200×700像素;
若比例K1.75,表示发票图像所对应的发票不正常,即发票两侧带圆孔的纸条被撕掉;此时在发票图像左右两端分别填充长度为(1.714*R-L)/2、宽度为R的白色纸条图像,再将所述的发票图像与白色纸条图像共同归一化至1200×700像素;
将发票图像转换至R通道,若在发票图像的表头位置检测不到像素点,表示发票图像中发票进行了倒置,此时将发票图像旋转180°。
进一步地,所述的发票图像进行倾斜校正,包括:
读取归一化后的发票图像并进行灰度转换;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811285202.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车牌类型的识别方法、装置及电子设备
- 下一篇:一种圆形印章识别方法及装置