[发明专利]一种基于文本行识别的车牌识别方法在审
申请号: | 202010735739.2 | 申请日: | 2020-07-28 |
公开(公告)号: | CN111914838A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 黄德双;秦魏 | 申请(专利权)人: | 同济大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06N3/04 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 识别 车牌 方法 | ||
1.一种基于文本行识别的车牌识别方法,其特征在于,包括以下步骤:
S1:获取原始图像;
S2:车牌检测步骤:检测原始图像中的车牌部分,得到车牌图像;
S3:文本行检测步骤:通过文本检测网络检测车牌上的文本行,得到车牌文本行图像;
S4:文本行识别步骤:将车牌文本行图像输入车牌文本行识别网络,最终输出车牌文本行的字符序列,完成车牌识别。
2.根据权利要求1所述的一种基于文本行识别的车牌识别方法,其特征在于,所述的步骤S2中,通过YOLOv3网络检测原始图像中的车牌部分。
3.根据权利要求2所述的一种基于文本行识别的车牌识别方法,其特征在于,所述的YOLOv3网络将原始图像的特征图维度经过五次降低,分别得到第一特征图、第二特征图、第三特征图、第四特征图和第五特征图,然后分别对第三特征图、第四特征图和第五特征图经过上采样后拼接,最后输出特征张量,完成对车牌的检测。
4.根据权利要求1所述的一种基于文本行识别的车牌识别方法,其特征在于,所述的步骤S3具体包括:
S31:利用回归模型预测得到CPTN网络的竖直检测框;
S32:对预测得到的竖直检测框进行边界优化;
S33:将竖直方向上重叠程度达到设定阈值的竖直检测框合并为一个检测框,得到最终的竖直检测框;
S34:CPTN网络通过竖直检测框进行文本行的检测,得到车牌文本行图像。
5.根据权利要求4所述的一种基于文本行识别的车牌识别方法,其特征在于,所述的竖直框检测框的中心位置tc和高度th的计算方法为:
th=log(hb/ha)
其中,为边界框的中心位置,hb为边界框的高度,为锚框的中心,ha为锚框的高度;
所述的边界优化为每一个竖直框检测框计算一个水平方向检测的偏移量tw,该偏移量tw的计算公式为:
其中,为最接近真实车牌水平边界的坐标,为竖直检测框中心位置的x坐标,wa为竖直检测框框的宽度。
6.根据权利要求1所述的一种基于文本行识别的车牌识别方法,其特征在于,所述的车牌文本识别网络包括校正网络和文本识别网络,分别实现对车牌文本行图像的校正和文字识别,所述的校正网络通过二维变换对失真和扭曲的文本进行校正,所述的文本识别网络采用编码器-解码器范式的内置注意力机制的seq2seq网络。
7.根据权利要求6所述的一种基于文本行识别的车牌识别方法,其特征在于,所述的校正网络包括定位网络,所述的定位网络对原始文本行的控制点向量组A进行预测,并通过反向传播梯度,回归分析得到校正文本行的控制点向量组Ar,所述的校正网络根据原始文本行控制点向量组C和校正文本行控制点向量组Ar之间的关系,对原始文本行图像进行二维变换,得到校正后的文本行图像。
8.根据权利要求7所述的一种基于文本行识别的车牌识别方法,其特征在于,所述的定位网络包括六个卷积滤波层、五个最大池化层和两个全连接层组层,所述的控制点包括五个,分别为车牌文本行的四个顶点和对角线的交点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010735739.2/1.html,转载请声明来源钻瓜专利网。