[发明专利]一种基于自注意力的车牌字符识别方法在审
申请号: | 202110802244.1 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113610088A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 张卡;何佳;戴亮亮;尼秀明 | 申请(专利权)人: | 安徽清新互联信息科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 闫客 |
地址: | 230088 安徽省合肥市高新区创新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 车牌 字符 识别 方法 | ||
1.一种基于自注意力的车牌字符识别方法,其特征在于,包括:
获取待识别车牌图像,并根据待识别车牌图像检测出包含车牌所在位置的局部车牌图像;
将局部车牌图像输入至车牌字符识别模型中,所述车牌字符识别模型包括特征提取网络、自注意力网络和字符识别网络;
特征提取网络提取所述局部车牌图像的高层特征图;
自注意力网络采用自注意力机制,对高层特征图进行处理,生成标准车牌位置特征图;
字符识别网络基于标准车牌位置特征图,识别出车牌字符。
2.如权利要求1所述的基于自注意力的车牌字符识别方法,其特征在于,所述特征提取网络包括卷积层conv0、最大值池化层maxpool0以及残差网络基础结构体block0、rblock1、rblock2;卷积层conv0的输入为所述待识别车牌图像、输出连接最大值池化层maxpool0,最大值池化层maxpool0输出依次连接残差网络基础结构体block0、rblock1、rblock2,残差网络基础结构体rblock2输出为所述高层特征图。
3.如权利要求2所述的基于自注意力的车牌字符识别方法,其特征在于,所述残差网络基础结构体block0、rblock1均包括卷积层rconv0、rconv1、rconv2、rconv3和rconv4,以及合并层eltsum0层和eltsum1层;
残差网络基础结构体block0中卷积层rconv0和rconv2的输入均为所述最大值池化层maxpool0所输出的特征图,残差网络基础结构体block1中卷积层rconv0和rconv2的输入均为所述残差网络基础结构体block0输出的特征图;卷积层rconv0的输出与卷积层rconv1的输入连接,卷积层rconv2的输出和卷积层rconv1的输出均与合并层eltsum0层的输入连接,合并层eltsum0层的输出经卷积层rconv3与卷积层rconv4的输入连接,卷积层rconv4的输出及合并层eltsum0层的输出均与合并层eltsum1层的输入连接,合并层eltsum1层输出特征图。
4.如权利要求2所述的基于自注意力的车牌字符识别方法,其特征在于,所述残差网络基础结构体block2包括卷积层rconv0、rconv1和rconv2以及合并层eltsum0层;卷积层rconv0和rconv2的输入均为所述残差网络基础结构体block1输出的特征图,卷积层rconv0的输出与卷积层rconv1连接,卷积层rconv1和卷积层rconv2的输出均与合并层eltsum0层连接,合并层eltsum0层输出为所述高层特征图。
5.如权利要求1所述的基于自注意力的车牌字符识别方法,其特征在于,所述自注意力网络包括特征图相加层sum0、特征图尺寸变换层reshape0和reshape1以及encoder模块;特征图相加层sum0的输入为所述高层特征图、位置编码特征图、类型编码特征图和形状编码特征图,特征图相加层sum0的输出经特征图尺寸变换层reshape0与encoder模块连接,encoder模块的输出与特征图尺寸变换层reshape1连接,特征图尺寸变换层reshape1输出为所述标准车牌位置特征图;首次执行时,encoder模块的输入为特征图尺寸变换层reshape0输出的特征图,并将encoder模块输出的特征图作为下次执行时encoder模块的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽清新互联信息科技有限公司,未经安徽清新互联信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110802244.1/1.html,转载请声明来源钻瓜专利网。