[发明专利]一种基于深度神经网络的票据数量识别方法及系统在审
申请号: | 202011456986.5 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112749731A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 徐书豪;金洪亮;梅俊辉;王芳;闫凯;王志刚;林文辉 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 姜丽辉 |
地址: | 100195 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 神经网络 票据 数量 识别 方法 系统 | ||
本发明公开了一种基于深度神经网络的票据数量识别方法及系统,将获取的二维的混拍票据原始图像依次进行灰度化处理、二值化处理、归一化处理和二维图像映射一维数据处理,在保留图像信息的同时极大的降低数据量,减少数据传输造成的时间浪费,提升用户体验;通过设计OCTC模型,引入一维卷积操作对图像数据进行特征抽取与图像类别计算,使用多个小尺寸卷积核增大模型感受野,保证实验效果的同时降低模型参数量,实现轻量化模型的效果,便于用户储存使用;本发明的方法能够使用户在上传图像的同时能够收到图像中票据数量的判断结果,提升了混拍票据识别系统的用户体验,同时帮助系统进行后续的票据目标检测与内容识别任务,实现系统的实时工作。
技术领域
本发明涉及票据处理技术领域,并且更具体地,涉及一种基于深度神经网络的票据数量识别方法。
背景技术
票据数量识别方法,用于混拍票据识别系统初期的票据预判阶段。目前,市面上针对票据识别主要基于AlexNet、Fast-RCNN、OCR等技术识别图像中的票据信息,此类方法经过长期的使用与校验,拥有较好的稳定性与表现效果,但由于模型的固定性导致适用情况受限,无法根据实际情况进行相应调节。此外,票据识别系统通过引入目标检测操作进行票据分析,由于真实场景下拍摄的票据存在重叠、倾斜、分辨率低等问题,这将影响模型能够检测到的区域,从而降低模型效果。
因此,需要一种能够快速准确地对票据数量识别的方法,以能够辅助检测模型进行监测区域预判,提升检测正确率。
发明内容
本发明提出一种基于深度神经网络的票据数量识别方法及系统,以解决如何快速对图像的票据数量进行识别的问题。
为了解决上述问题,根据本发明的一个方面,提供了一种基于深度神经网络的票据数量识别方法,所述方法包括:
获取多组不同的混合票据中每组混合票据对应的混拍票据原始图像,并对获取的每个混拍票据原始图像进行预处理,以获取每个混拍票据原始图像对应的混拍票据处理图像;
基于深度神经网络构建一维卷积票据分类(One-dimensional ConvolutionalTicket Classification,OCTC)模型,并利用获取的每个混拍票据处理图像对所述OCTC模型进行训练,以确定OCTC最优模型;
获取待测的混拍票据原始图像,并对所述待测的混拍票据原始图像进行处理,以获取待测的混拍票据处理图像;
利用所述OCTC最优模型对所述待测的混拍票据处理图像进行票据数量识别,以获取票据数量识别结果。
优选地,其中所述混合票据的类型包括:增值税发票、火车票、定额票、营业执照、卷票、身份证、出租车票、机动车销售和航空行程单。
优选地,其中所述方法利用如下方式对混拍票据原始图像进行预处理,以获取与混拍票据原始图像对应的混拍票据处理图像,包括:
对混拍票据原始图像依次进行灰度化处理、二值化处理、归一化处理和二维图像映射一维数据处理,以获取与混拍票据原始图像对应的混拍票据处理图像。
优选地,其中所述归一化处理和二维图像映射一维数据处理,包括:
其中,Xi,j为混拍票据原始图像的原像素值,μi为混拍票据原始图像中行像素值的均值,σi为对应的方差,为按行归一化后的像素值;将归一化后的像素累加得到映射后的一维行向量,即一维映射数据
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011456986.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种非水液体介质的高压电极加热装置
- 下一篇:一种自动去毛边的造鞋模具