[发明专利]一种非二值化和边缘检测的车牌字符图像分割方法有效
申请号: | 201910371724.X | 申请日: | 2019-05-06 |
公开(公告)号: | CN110210475B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 祁忠琪;涂凯 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 非二值化 边缘 检测 车牌 字符 图像 分割 方法 | ||
1.一种非二值化和边缘检测的车牌字符图像分割方法,其特征在于:该方法包括以下步骤:
1)获取车牌的字符样本图片和非字符样本图片;每个字符样本图片和每个非字符样本图片均具有一个标签,每个字符样本图片具有的标签为字符标签,每个非字符样本图片具有的标签为非字符标签;
2)构建用于识别输入图片为非字符或字符二分类的深度学习网络,使用步骤1)图片输入进行训练,完成训练后保存深度神经网络的权重参数数据Q,获得字符判别网络;
3)获取车牌的完整图像作为车牌图片,预先通过检测算法对车牌图片进行字符区域的检测定位得到车牌字符区域,并设定滑动窗口的大小;
4)将滑动窗口在步骤3)的字符区域内从左向右进行滑动遍历形成一系列窗口,并将窗口内的图像区域输入到步骤2)所训练好的字符判别网络,得到窗口内是否包含单个字符的字符概率,然后针对一系列窗口及其对应的字符概率进行优化处理删除伪字符窗口和重叠度较大的窗口,保留的窗口即为车牌中的字符,完成车牌字符图像的分割;
所述步骤2)中深度学习网络如下:
2.1)深度分类网络包括输入层、第一简单卷积层模块、第二简单卷积层模块,卷积池化模块、第三简单卷积层模块、卷积模块、合并层、一维数据转换层、全连接层、ReLU函数激活层、Dropout层、Softmax函数分类输出层和输出层;输入层输入到第一简单卷积层模块,第一简单卷积层模块的输出分别连接到第二简单卷积层模块和卷积模块,第二简单卷积层模块和卷积模块的输出连接到合并层进行合并处理,合并层的输出依次经卷积池化模块、第三简单卷积层模块连接到一维数据转换层转换为一维数据,一维数据转换层的输出依次经全连接层、ReLU函数激活层、Dropout层、Softmax函数分类输出层连接到输出层;
所述的第一简单卷积层模块、第二简单卷积层模块和第三简单卷积层模块结构相同,均包括一个卷积层和一个ReLU函数激活层,卷积层使用大小为3×3的卷积核;
所述的卷积模块包括四个分支,第一简单卷积层模块的输出分别输入到四个分支:第一个分支是有64个大小为3×3卷积核的卷积层;第二个分支是依次连接的有48个大小为1×1卷积核和有64个大小为5×5卷积核的两个卷积层;第三个分支是依次连接的有64个大小为1×1卷积核和有96个大小为3×3卷积核的两个卷积层;第四个分支是依次连接的3×3大小的平均池化层和有32个大小为1×1卷积核的卷积层;卷积模块中每个分支的最后一个卷积层的步长均为2,其余卷积和池化操作均采用步长为1;
所述的卷积池化模块包括依次连接的一个卷积层、一个ReLU函数激活层和一个最大池化层,最大池化层使用大小为2×2、步长为2的池化窗口;
2.2)将步骤2)的训练数据输入到深度学习分类网络的输入层,采用保留率为0.9的Momentum优化算法训练神经网络,直到深度学习分类网络的误差达到最小值并保持稳定,则保存此时深度学习分类网络中的权重参数数据Q,其中损失函数为交叉熵损失,学习率设置为初始值为0.01、衰减速度为150步、衰减率为0.9的指数衰减法,训练时Dropout层采用0.5的节点保留率。
2.根据权利要求1所述的一种非二值化和边缘检测的车牌字符图像分割方法,其特征在于:所述步骤1)具体为:通过滑动窗口在车牌图片中进行滑动:若有完整字符出现在滑动窗口中,则保存窗口,并以窗口构建字符样本图片;若仅有完整字符的局部或完全无字符出现在滑动窗口中,则保存窗口,并以窗口构建非字符样本图片。
3.根据权利要求1所述的一种非二值化和边缘检测的车牌字符图像分割方法,其特征在于:所述步骤3)具体为:使用MobileNet SSD模型或者Opencv软件的级联分类器(Cascade检测器)在车牌图片内进行字符区域的定位,得到能够将字符区域紧密包围的包围框B,包围框B为内部只有且有包含单个完整字符和车牌底纹的字符区域;然后建立与包围框B等高、但宽度为包围框B高度一半的滑动窗口。
4.根据权利要求1所述的一种非二值化和边缘检测的车牌字符图像分割方法,其特征在于:所述步骤4)中优化处理具体为:
4.1)通过概率阈值进行筛选,保留所有字符概率大于概率阈值的所有窗口,并构成候选字符包围框集合;
4.2)在候选字符包围框集合上进行聚类,计算其中每两个窗口之间的交并比IOU,将交并比IOU大于交并比阈值的窗口归为一类;
4.3)在同一类窗口内取字符概率最大的窗口作为最终的字符框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910371724.X/1.html,转载请声明来源钻瓜专利网。