[发明专利]基于异构双线性注意力网络的图像检索方法有效
申请号: | 201910692241.X | 申请日: | 2019-07-30 |
公开(公告)号: | CN110532409B | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 王鹏;苏海波 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06F16/583 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双线 注意力 网络 图像 检索 方法 | ||
1.一种基于异构双线性注意力网络的图像检索方法,其特征在于步骤如下:
步骤1:将一张图片经过hour-glass网络后得到一个特征图同时经过Inception-Resnet-v2网络得到另一个特征图
步骤2:对这两个特征图分别作整体平均池化,得到两个向量和
va=GlobalAveragePooling(Va), (1)
vl=GlobalAveragePooling(Vl). (2)
步骤3:将va和vl拼接成一个向量,然后经过并行的两个多层感知器,从而计算出每个支路的特征图的channel-wise的注意力权重;具体计算公式如下:
这里的都是线性转换矩阵;ka和kl是投射维度,为拼接操作所以C=Ca+Cl,αa为分配给属性分类支路的channel-wise注意力权重,αl为分配给关键区域定位支路的channel-wise注意力权重;Sigmoid和Relu为常用的激活函数;
步骤4:得到两个加权的特征图然后把它们重新采样到相同的空间大小W×H;
步骤5:给定步骤4得到的特征图(i,j)位置上的特征向量使用count sketch函数Ψ把xij投射到目的向量这里还用到了一个符号向量和一个映射向量s中的每一个值都是从{+1,-1}中以相同的概率随机选择的;P中的每个值则是从{1,...,d}中以均匀分布的概率从中选取;count sketch函数Ψ定义如下:
yij=Ψ(xij,s,p)=[v1,...,vd], (5)
这里的vt=∑ls[l]·xij[l],使得p[l]=t;把两个向量和的卷积作为countsketch函数的输入,那么这个count sketch函数写成把单独向量作为输入的两个countsketch函数的卷积:
这里⊙表示外积操作,*表示卷积操作;最终通过时域以及频域的转换来得到双线性特征:
其中,为元素集的相乘;
步骤6:在训练时,把最终得到的双线性特征作ID分类训练;在测试时,计算查询图像与数据库中的图像所得到的正则化后的双线性特征,然后计算它们之间的欧式距离,即得到最终的top-k的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910692241.X/1.html,转载请声明来源钻瓜专利网。