[发明专利]一种基于深度学习的银行卡号识别方法在审
申请号: | 201910868191.6 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110781892A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 唐明浩;李非凡;李清淳 | 申请(专利权)人: | 河海大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46;G06K9/62;G06N3/08 |
代理公司: | 32204 南京苏高专利商标事务所(普通合伙) | 代理人: | 成立珍 |
地址: | 210019 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 滑动窗口 银行卡号 识别率 平移 从上至下 判别结果 判别模型 像素水平 训练模型 移动步伐 凹凸卡 小滑块 检测 滑块 拉伸 矫正 卡片 判定 改进 容纳 优化 学习 图片 | ||
1.一种基于深度学习的银行卡号识别方法,其特征在于:具体步骤如下:
步骤1:对训练数据进行预处理,得到处理好的单数字图片,以供模型训练;
步骤2:使用改进的VggNet作为基本骨架模型,输入大量银行卡单独数字的图片训练辨别模型,辨别模型对一个字符大小的图片判断是哪一个数字还是并非数字,输入图片拉伸大小为64*64,采用SGD优化方法训练模型,得到可以识别卡号的模型;
步骤3:以0.1*银行卡卡片的高度作为滑动窗口的高,以卡片的宽度作为滑动窗口的宽,以0.25*滑动窗口大小为单次平移距离,向下平移并做识别,依赖识别阈值来判定窗口的位置,同时产生判别结果,实现银行卡号的定位和卡号的识别;
步骤4:运用应用程序框架PyQt进行GUI设计,为用户展示基于深度学习的银行卡号识别系统。
2.如权利要求1所述的基于深度学习的银行卡号识别方法,其特征在于:步骤1中对于要检测的卡片,根据卡片的像素水平排列度做sigma变换,利用sigma公式进行图像旋转的操作,将倾斜图片矫正成水平方向,根据卡片与背景差别,提取银行卡卡片轮廓。
3.如权利要求2所述的基于深度学习的银行卡号识别方法,其特征在于:具体过程如下:
首先,进行处理图像,将原始的多位数字图片切割为单个数字,并且通过flip、Rotation、noise、brighter、darker操作实现数据的增强,然后填充因图像移动导致的空白区域,处理过后的图片统一保存到特定文件夹下以供训练使用。
4.如权利要求1所述的基于深度学习的银行卡号识别方法,其特征在于:步骤2中使用改进的VggNet作为骨架模型进行银行卡号识别的具体内容为:
使用VggNet模型作为模型思想,模型最初做通道值判断图形类别,适配不同的工具包的情况,具体卷积均为3x3卷积,初始规定的特征点数目比经典模型小一倍;
初始化方式是使用高斯截断,然后在全连接层上添加0.2的损失值,以适合更多场景;同时在学习率上采取周期降低的方式,即decay=learnrate/epoc,其中decay指学习率的衰减,learnrate指学习率,epoch指训练集中的全部样本训练次数。
5.如权利要求1所述的基于深度学习的银行卡号识别方法,其特征在于:步骤3中使用检测定位的滑动窗口定位方式进行银行卡号定位的具体内容为:
首先依赖滑块处理进行判别阈值确定,在阈值最高值处进行定位来检测数字字符,通过判定一整行数字是否符合银行卡号16-19位的特征,即可得到识别结果;
其中每个滑动窗口中都做单个字符的窗口处理,每次识别到一个判别值较高的数字便做一整个滑块位移;同时,通过二次浮动比对进行对部分数字的优化,以减小误差,最终得到目标区域的一整行数字内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910868191.6/1.html,转载请声明来源钻瓜专利网。