[发明专利]一种多角度车型识别方法及系统在审
申请号: | 201910044136.5 | 申请日: | 2019-01-17 |
公开(公告)号: | CN109902563A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 蔡晓东;万今朝 | 申请(专利权)人: | 桂林远望智能通信科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G08G1/017;G06N3/04 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 蒋杰 |
地址: | 541004 广西壮族自治区*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 预处理 车辆数据库 测试样本 车辆识别 车型识别 训练图片 构建 卷积 注意力机制 车辆图片 分类识别 可分离 图片 | ||
1.一种多角度车型识别方法,其特征在于,所述方法包括以下步骤:
收集多角度车辆图片,构建多角度车辆数据库,进行预处理获得多角度车辆训练图片,未经预处理的图片作为测试样本图片;
构建卷积神经网络,在所述卷积神经网络中增加注意力机制,使用深度可分离卷积代替传统卷积;
对所述多角度车辆训练图片进行卷积神经网络训练,获得多角度车辆识别模型;
通过所述车辆识别模型对所述多角度车辆数据库内的所述测试样本图片进行分类识别。
2.根据权利要求1所述的方法,其特征在于,所述进行预处理获取多角度车辆训练图片,具体包括以下步骤:
将所述多角度车辆图片剪裁成统一大小,以及对所述剪裁成统一大小的多角度车辆图片进行旋转和镜像,得到数据增强后的样本图片;
将所述数据增强后的样本图片进行灰度化处理,得到多角度车辆训练图片。
3.根据权利要求1所述的方法,其特征在于,所述构建卷积神经网络,在所述卷积神经网络中增加注意力机制,使用深度可分离卷积代替传统卷积,具体包括以下步骤:
构建卷积神经网络,所述卷积神经网络包括数据输入层、Resnet18网络卷积层、特征层、全连接特征提取层、Drop_out层、全连接分类层和分类损失层;
在所述卷积神经网络中增加注意力机制结构,依次连接Conv1层、Conv2层、全局平均池化层、Fc1层、ReLU层、Fc2层、Sigmoid层,以及与所述Conv2层相连接的Scale层;
在所述卷积神经网络中,将传统卷积核为3*3的卷积层替换成卷积核为3*3的深度卷积层和卷积核为1*1的逐点卷积层,所述深度卷积和逐点卷积合称为深度可分离卷积,在1*1逐点卷积运算后,不使用ReLU激活函数。
4.根据权利要求1或3所述的方法,其特征在于,所述注意力机制具体包括:
特征压缩阶段:使用所述全局平均池化层,将所述卷积层的每个通道的二维特征变成一个实数,对所述二维特征进行压缩;
特征激励阶段:使用一个全连接层,将输入的所述二维特征的通道数降低,减少通道的个数,降低计算量;连接ReLU激活函数,保持输出维度不变,得到非线性特征;再通过一个全连接层变回原来的维度,经过Sigmoid函数将特征权重归一化到0-1之间;
特征重标定阶段:使用所述缩放层对每个所述二维特征的通道的权重进行重新标定,将所述二维特征激励操作后输出的权重加权到每个所述通道的二维特征上,以此完成对原始二维特征的重新标定。
5.根据权利要求1或3所述的方法,其特征在于,所述深度可分离卷积用于计算复杂度,所述深度可分离卷积计算复杂度具体包括:
深度可分离卷积首先是一组二维的卷积核,其中卷积核的通道数为1,每次只处理一个输入通道,其中二维卷积核的数量与输入通道数一样。逐个卷积处理之后,使用三维1×1的卷积核来处理之前输出的特征图,最终输出的通道数变成了一个指定的数量。一组与通道数相同的二维卷积核的计算量为:
Dk×Dk×M×Df×Df
三维1×1卷积核的计算量为:
N×M×Df×Df
所以使用深度可分离卷积总的计算量为:
Dk×Dk×M×Df×Df+N×M×Df×Df
因此使用深度可分离卷积与传统卷积的计算量之比为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林远望智能通信科技有限公司,未经桂林远望智能通信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910044136.5/1.html,转载请声明来源钻瓜专利网。