[发明专利]一种多类别交通工具的精细识别方法有效
申请号: | 202010007923.5 | 申请日: | 2020-01-02 |
公开(公告)号: | CN111191626B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 曹先彬;罗晓燕;杜文博;李晓欢;杨燕丹;胡宇韬 | 申请(专利权)人: | 北京航空航天大学;桂林电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 冀学军 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 类别 交通工具 精细 识别 方法 | ||
1.一种多类别交通工具的精细识别方法,其特征在于,具体步骤如下:
步骤一、针对某张待分类的目标图像输入VGG19网络中,输出包含网络浅层信息的特征图X;
步骤二、对具有浅层信息的特征图X加入级联注意力机制,得到重要区域的高亮显示特征图
具体为:
首先,对于特征图X,通过1×1的卷积得到三维的注意力权重图M1(X),然后将注意力权重图M1(X)中每个权重分别与原始特征图X中各自对应的像素进行一一相乘,即并借助残差方法,对逐像素相加,得到第一结果:
同时,采用3×3的卷积对原始特征图X进行特征提取,然后对提取结果进行边界补全,得到和原始特征图X相同尺寸的三维的注意力权重图M2(X);
然后,将注意力权重图M2(X)中每个权重分别与第一结果中各自对应的像素进行一一相乘,最后借助残差方法,与原始特征图X逐像素相加,得到与原始特征图X尺寸相同的重要区域的高亮显示特征图
步骤三、从纵向和切向两个角度嵌入核函数,提取高亮显示特征图的高维非线性特征,得到两个不同方向的高维非线性特征图X′和Y′;
具体为:
首先,将特征图中的每一个纵向向量看作一维特征向量xi∈RC;
同时,将每一个切向向量看作二维特征向量xj∈RW×H,然后把每个二维的切向向量xj∈RW×H变形到长度为W×H的一维特征向量yj;
最后,将两个一维特征向量xi和yj分别接入一个含余弦函数激活的非线性层,得到两个不同方向的高维非线性特征图X′和Y′;含余弦函数激活的非线性层包含一层卷积层和一层余弦激活函数;
具体为:
两个一维特征向量xi和yj分别与卷积层的卷积核参数W相乘,然后与卷积层的偏置参数b相加,再经过余弦激活函数得到对应位置的高维非线性特征向量X′i,Y′j,
计算公式如下:
X′i=cos(Wxi+b)
Y′j=cos(Wyj+b)
将所有切向向量输出X′i,Y′j分别组合得到两个高维非线性特征图X′和Y′;
步骤四、使用平均池化将两个高维非线性特征图X′和Y′分别进行特征降维,得到长度为C的两个特征向量,拼接后得到长度为2C的一个特征向量A;
步骤五、对长度为2C的特征向量A使用全连接进行融合,得到一个长度为类别数的特征向量B;
特征向量B中每个分量是对应类别的置信度分数;
步骤六、使用softmax机制对特征向量B中各类别的置信度分数进行归一化,取分数最大值,得到对应的分类的结果。
2.如权利要求1所述的一种多类别交通工具的精细识别方法,其特征在于,所述的步骤一中,VGG19网络包括16个卷积层和3个全连接层,其中卷积层都使用的是3x3的卷积和2x2的最大池化层;将VGG19网络中除去卷积模块的部分取缔,卷积模块的输出特征图大小为C×W×H;W代表特征图的宽,H代表特征图的高,C代表特征图的通道数。
3.如权利要求1所述的一种多类别交通工具的精细识别方法,其特征在于,步骤五中所述的类别包括:各种交通工具的分类,同一类交通工具的不同品牌类别,或者同一品牌类的不同型号类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;桂林电子科技大学,未经北京航空航天大学;桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010007923.5/1.html,转载请声明来源钻瓜专利网。