[发明专利]基于VLAD卷积模块的图像信息强化方法有效
申请号: | 201910305793.0 | 申请日: | 2019-04-16 |
公开(公告)号: | CN110135460B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 袁嘉杰;张灵 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/762;G06V10/82;G06N3/0464;G06N3/0442;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 vlad 卷积 模块 图像 信息 强化 方法 | ||
1.基于VLAD卷积模块的图像信息强化方法,其特征在于,包括以下步骤:
S1、初始化局部聚合描述子向量卷积模块参数,设定卷积模块中的K个D维的聚类中心和K+G个卷积核,其中,D、K、G为正整数;
S2、将通道数为D的中间特征图输入局部聚合描述子向量卷积模块后分别进行以下操作:中间特征图进行压缩得到大小为K,通道数为D的压缩特征图;将中间特征图进行一次卷积操作,并通过归一化指数函数进行归一化,得到K+G个输出权重;所述局部聚合描述子向量卷积模块包括树干分支和旁路分支,其中所述树干分支由两组残差模块构成并与深度神经网络衔接,所述旁路分支为局部聚合描述子向量层,所述局部聚合描述子向量层包括K+G个卷积核和K个聚类中心;所述局部聚合描述子向量卷积模块参数还包括K+G个偏置项,所述偏置项用于参与中间特征图的卷积操作;
S3、将K+G个输出权重进行各自求和,保留求和结果较大的K个输出权重,将求和结果最小的G个输出权重舍弃;
S4、将聚类中心分别与中间特征图中的特征向量进行差值运算,得到每个通道的残差;
S5、将S3步骤保留的K个输出权重与每个通道的残差中对应的元素相乘,再将各通道的所有差值进行累加,得到K个固定向量;
S6、将固定向量通过归一化指数函数进行归一化处理,得到鉴别特征;
S7、将鉴别特征与压缩特征图进行逐通道相乘,输出的特征图即为完成信息强化的图像。
2.根据权利要求1所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述局部聚合描述子向量卷积模块包括树干分支和旁路分支,其中所述树干分支由两组残差模块构成并与深度神经网络衔接,所述旁路分支为局部聚合描述子向量层,所述局部聚合描述子向量层包括K+G个卷积核和K个聚类中心。
3.根据权利要求2所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述S2的具体步骤如下:
S201、将通道数为D,大小为H×W的中间特征图输入局部聚合描述子向量卷积模块中,中间特征图通过卷积模块的树干分支得到大小为K,通道数为D的压缩特征图;
S202、中间特征图通过卷积模块的旁路分支,中间特征图被处理为D个H×W维的特征向量,然后对特征向量进行一次卷积操作,并通过归一化指数函数进行归一化处理,得到K+G个输出权重,其中输出权重为H×W大小的矩阵。
4.根据权利要求1所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述S1步骤中卷积核的大小为(D,1)。
5.根据权利要求1所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述局部聚合描述子向量卷积模块参数还包括K+G个偏置项,所述偏置项用于参与中间特征图的卷积操作。
6.根据权利要求1所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述S5步骤中的固定向量的计算公式如下:
其中,V(j,k)为固定向量,表示第j个通道维度上的中间特征图与第k个聚类中心的差值之和,xi(j)表示通道维度为j的中间特征图上第i个值,ck表示第k个聚类中心上第j维度上的值,Wk表示输出权重。
7.根据权利要求1所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述S6步骤中的鉴别特征的范围为0~1。
8.根据权利要求1~7任一项所述的基于VLAD卷积模块的图像信息强化方法,其特征在于:所述方法应用于ResNet50深度残差网络中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910305793.0/1.html,转载请声明来源钻瓜专利网。