[发明专利]一种基于双循环转录网络的车牌字符识别方法有效
申请号: | 202010138872.X | 申请日: | 2020-03-03 |
公开(公告)号: | CN111461112B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 谢巍;王缙;潘春文;吴伟林;廉胤东 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/19;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蒋剑明 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双循环 转录 网络 车牌 字符 识别 方法 | ||
本发明公开了一种基于双循环转录网络的车牌字符识别方法,用于对车牌图像中样本失衡的汉字字符、英文字符、数字字符进行识别,包括以下步骤:首先通过卷积神经网络提取车牌图像特征,然后在双循环转录网络内搭建两个并行排列的Bi‑LSTM,两个并行排列的Bi‑LSTM分别对汉字字符和英文字符、数字字符进行特征计算,得到车牌字符置信度估计序列,最后通过转录层对车牌字符置信度估计序列进行映射,得到预测标签。该发明成功解决了在车牌字符识别中训练样本失衡问题,提升了车牌字符识别方法的准确率。另外,通过在实际场景应用该车牌字符识别方法,验证本发明的有效性。
技术领域
本发明涉及计算机视觉和模式识别技术领域,具体涉及一种基于双循环转录网络的车牌字符识别方法。
背景技术
在很多深度学习任务中,训练集中存在某些类别下的样本数远大于另一些类别下的样本数,这就是样本失衡。样本失衡问题在车牌数据集上尤为明显。对于单排字符车牌,第一位的字符为省份字符,第二位至第七位字符为英文和数字字符,在车牌数据集中,数字和英文字符数量是汉字字符的数倍,因此存在严重的样本失衡问题,其中样本数目较少的类别被称为困难样本,样本数目较多的类别称为简单样本。样本失衡问题将导致车牌字符识别精度低的问题。
传统方法通过对困难样本增加权重来加强对困难样本的学习,但对于序列字符识别,该方法并不适用。因此本专利提出一种基于双循环转录网络的车牌字符识别方法来解决在车牌数据集中的样本失衡问题。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于双循环转录网络的车牌字符识别方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于双循环转录网络的车牌字符识别方法,所述的车牌字符识别方法包括构建、训练双循环转录网络和应用双循环转录网络进行车牌识别,其中,所述的构建、训练双循环转录网络包括以下步骤:
S1、使用卷积层、池化层、Relu层构造深度卷积神经网络,对车牌图像进行特征提取,得到包含相对位置信息和时序信息的序列特征图x={x1,x2,…xi…,xT},其中xi∈R256,xi表示序列特征图的第i帧序列,T表示序列特征图宽度;
S2、构建Bi-LSTM(Bi-directional Long Short-Term Memory),将序列特征图全部输入到Bi-LSTM,得到车牌字符置信度估计序列p={p1,p2,…,pT},其中T表示置信度估计序列p的长度,p和x长度相等,所述的Bi-LSTM由两个并行的循环层构成,两个循环层传播方向相反,每个循环层由T个LSTM单元链式连接而成,LSTM单元内含有输入门和输出门,将序列特征图的第i,i=1,2,…,T帧序列xi对应输入到第i,i=1,2,…,T个LSTM单元的输入门,然后用softmax激活函数对LSTM输出门输出的值进行转化,得到车牌字符置信度估计序列p;
S3、构建转录层,对车牌字符置信度估计序列p进行映射,得到预测标签序列;
S4、构建双循环转录网络,双循环转录网络由一个深度卷积神经网络和两个并行排列的Bi-LSTM构成,两个Bi-LSTM分别称为第一Bi-LSTM和第二Bi-LSTM,深度卷积神经网络输出的序列特征图x分别输入第一Bi-LSTM和第二Bi-LSTM,对第一Bi-LSTM输出的车牌字符置信度估计序列进行转录,得到汉字字符预测标签序列,对第二Bi-LSTM输出的车牌字符置信度估计序列进行转录,得到英文字符和数字字符的预测标签序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010138872.X/2.html,转载请声明来源钻瓜专利网。