[发明专利]一种基于注意力机制哈希检索的图像匹配方法在审

专利信息
申请号: 202010671742.2 申请日: 2020-07-13
公开(公告)号: CN111858984A 公开(公告)日: 2020-10-30
发明(设计)人: 凌泽乐;高岩;高明;金长新 申请(专利权)人: 济南浪潮高新科技投资发展有限公司
主分类号: G06F16/532 分类号: G06F16/532;G06F16/55;G06K9/62
代理公司: 济南泉城专利商标事务所 37218 代理人: 李桂存
地址: 250104 山东省济南市*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 注意力 机制 检索 图像 匹配 方法
【权利要求书】:

1.一种基于注意力机制哈希检索的图像匹配方法,其特征在于,包括如下步骤:

a)获取训练集原始图片,将图片分别对应不同残差网络进行输入;

b)将训练样本输入预训练模型中,通过最小化损失函数优化预训练模型参数;

c)固定优化后的预训练哈希检索模型,将步骤a)中的所有图片通过优化后的预训练哈希检索模型得到对应的哈希码,并将哈希码输入数据库中;

d)使用模型匹配任务时,将图片样本输入优化后的预训练哈希检索模型中生成该图片模态对应的哈希码,在另一模态的哈希码数据库中寻找与其海明距离最近的N个哈希码;

e)将得到的N个哈希码返回结果,将N个哈希码进行逆向处理得到图片数据。

2.根据权利要求1所述的基于注意力机制哈希检索的图像匹配方法,其特征在于:步骤b)中通过迭代优化的方式优化模型参数。

3.根据权利要求1所述的基于注意力机制哈希检索的图像匹配方法,其特征在于:

步骤b)中优化预训练模型参数包括如下步骤:

b-1)生成具有多级语义的相似性矩阵S;

b-2)提取训练样本中的图片的模态特征,得到图像模态特征Pi,对训练样本中的图片进行分类任务处理,输出注意力图像;

b-3)将图像模态特征Pi与注意力图像进行点乘,得到图片模态的特征表示Fi和文本模态的特征表示Fj;

b-4)采用损失函数对哈希模型进行迭代优化,得到优化后的哈希检索模型。

4.根据权利要求1所述的基于注意力机制哈希检索的图像匹配方法,其特征在于:步骤b-1)中具有多级语义的相似性矩阵S表示为其中|ci|表示训练样本i所具有的类别数,|cj|表示训练样本j所具有的类别数,D(i,j)为训练样本i和训练样本j所共有的类别数。

5.根据权利要求1所述的基于注意力机制哈希检索的图像匹配方法,其特征在于:步骤b-2)中采用Resnet101网络提取训练样本中的图片的模态特征,得到图像模态特征Pi,采用Resnet101网络将训练样本中的图片去掉全连接层后加入平均池化层,输出位样本类别数据,Resnet101网络对图片进行分类任务,在最后一层加入Attention机制后输出为注意力图像。

6.根据权利要求1所述的基于注意力机制哈希检索的图像匹配方法,其特征在于:步骤b-3)中将图像模态特征Pi与注意力图像进行点乘后的结果作为输入进入全连接层得到图片模态的特征Fi,将文本模条的BOW表示输入到全连接层得到文本模态的特征表示Fj。

7.根据权利要求1所述的基于注意力机制哈希检索的图像匹配方法,其特征在于:步骤b-4)中通过公式计算得到损失函数L,式中Sij为训练样本i和训练样本j组成的相似性矩阵,σ为常数,FiT为图片模态的特征表示Fi的转置,L2为量化损失,L3为平衡损失,n为训练样本i和训练样本j的最大数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010671742.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top