[发明专利]一种污损发票识别方法在审
申请号: | 202110107015.8 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112800946A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 宋晓茹;成思齐;任盼飞;王婧;杨佳;李彤晖 | 申请(专利权)人: | 西安工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 西安新思维专利商标事务所有限公司 61114 | 代理人: | 黄秦芳 |
地址: | 710032 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 污损 发票 识别 方法 | ||
本发明涉及改进AlexNet对不平衡小样本污损发票识别方法。该方法主要如下:针对数据集中的正负样本不平衡问题,利用DCGAN生成对抗网络生成相似的数据样本增加受损发票多样性。再是对AlexNet网络进行针对性改进,有三个改进点:一是加入了1*1卷积核,既帮助减少模型参数,又能增加网络层深度,提升网络模型的特征提取能力;二是加入了通道洗牌模块,将各种特征打乱分布,提高网络对于图片多种特征的更深层次的抓取能力和网络识别的泛化能力和鲁棒性;三是加入了SE模块,通过对特征通道间的相关性进行建模,强化重要的特征来提升准确率。本发明通过这三点改进AlexNet用于发票识别,针对实际中遇到的破损发票的识别率以及提高识别方法的泛化性和鲁棒性。
技术领域
本发明属于计算机视觉和人工智能技术领域,具体涉及一种污损发票识别方法。
背景技术
发票自动识别系统是目前文本分类中一个比较热点的方向,发票自动处理系统主要涉及到图像处理、模式识别等方面的学科知识,主要包括图像预处理、信息区域定位、字符切割和识别等处理过程,已被广泛应用于信息处理、差旅报销和人机交互等领域。而由于现实生活中的发票可能存在多种保存问题以及难以预测的污损,由于发票样式的固定性,发票号码和纳税人识别号分别在右上角和左上角,这两个地方被污染的可能性高于其它地方,但如果是折痕或者有大片污迹其它区域的样本也有可能会受损。针对污损发票的识别成为一项重要的研究热点。
使用机器学习方法进行图像识别主要在于对图像特征的提取,特征提取的有效性影响着识别准确率的高低。深度学习作为机器学习一个新的分支,通过模拟人脑机制对数据信息进行分析处理。深度学习中的卷积神经网络在图像识别领域取得了重大突破,能够自学习图像由低级到高级的特征,避免了机器学习中手动提取特征的缺点。但卷积神经网络在训练时需要海量样本的支撑,在数据不足时,会出现过拟合问题。
此外,训练样本的不平衡问题是一个值得思考的问题。训练样本某些权值分布较大,某些权值分布较小,最终会影响到卷积神经网络模型的训练和预测时的置信度。
因此,需要一种新的技术方案来解决利用卷积神经网络对小样本图像识别时会发生的过拟合问题和样本不平衡时置信度低的问题。
发明内容
本发明提供了一种污损发票识别方法,解决了现有识别方法样本的不平衡问题、传统机器学习方法手动提取特征效率低的问题、现有卷积神经网络需要大量样本支撑训练的问题、现有方法对破损发票进行识别鲁棒性差的问题。
为了达到上述目的,本发明所采用的技术方案是:
一种污损发票识别方法,包括以下步骤:
先不写,待定稿后由代理师撰写
本发明的有益效果:
本发明所提出的污损发票识别方法,通过搭建DCGAN对抗神经网络模型对少量标签进行扩充,降低了不平衡问题带来的置信度低的问题;利用卷积神经网络方法避免了手动提取特征的不足,通过改进CNN的方法解决了深度学习用时久耗费资源并需要大量样本支撑训练的缺点。该方法建立的深度神经网络模型,结构更加紧凑,需要的样本量更小,且对不平衡问题也有很好的解决办法。
附图说明
图1为本发明方法的流程图;
图2为本发明方法DCGAN神经网络的生成器模型设计;
图3为本发明方法DCGAN神经网络的判别器模型设计;
图4为两种不同大小卷积核参数对比示意图;
图5为本发明方法通道洗牌原理示意图;
图6为本发明方法SE模块原理示意图;
图7为本发明方法改进的AlexNet网络结构图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安工业大学,未经西安工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110107015.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于光波导的类谐振腔光提取结构
- 下一篇:一种紧固件及设计方法