[发明专利]基于虚拟标签回归的无监督跨模态哈希检索方法及系统有效
申请号: | 201910823366.1 | 申请日: | 2019-09-02 |
公开(公告)号: | CN110674323B | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 朱磊;王菲;王彤 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/53;G06F16/583;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 虚拟 标签 回归 监督 跨模态哈希 检索 方法 系统 | ||
1.一种基于虚拟标签回归的无监督跨模态哈希检索方法,其特征在于,步骤如下:
获取跨模态检索数据集,并将它们划分为训练集、测试集和数据库集,其中每个样本都包括成对的图像和文本两个模态的数据;
构建深度哈希网络模型并进行网络参数初始化,将两个模态的原始数据分别输入到所构建的深度哈希网络中,分别得到两个模态的哈希函数;
利用各模态的哈希函数获取测试集和数据库集中样本的哈希码,计算每个测试集样本的哈希码与数据库集样本的哈希码之间的汉明距离,数据库集样本按其对应的汉明距离升序排序,得到检索结果;
将两个模态的原始数据分别输入到所构建的深度哈希网络中,获取两个模态的深度特征矩阵,所述深度特征矩阵沿着网络继续传输,得到深度哈希网络的输出值;
根据训练集的深度特征矩阵、虚拟标签矩阵和深度哈希网络的输出值,分别构建深度特征的协同矩阵分解、虚拟标签的学习与回归以及哈希函数学习的损失函数,整合上述损失函数得到整体的目标函数,求解目标函数,分别得到两个模态的哈希函数,所述目标函数,具体为:
上式左边第一项通过深度特征的协同矩阵分解,分别建立两个模态样本的深度特征和共享哈希码之间的关联;第二项将虚拟标签矩阵G回归到哈希码B中,保持了哈希码和虚拟标签之间的语义一致性;第三项通过非负谱分析学习虚拟标签;第四项分别学习两种模态的深度哈希函数,Zt表示第t个模态的深度特征矩阵,Ut表示第t个模态的潜在因子矩阵,B是学习到的共享哈希码,αt是两个模态间的权重因子,η用来控制权重的分布,G表示虚拟标签矩阵,P是语义转换矩阵,L是图拉普拉斯矩阵,Ft(Xt;Wt)是深度哈希网络的输出值,λ、β和μ是正则化参数,I表示单位矩阵,n表示训练集样本点的个数,r表示哈希码的长度,Xt表示原始数据特征矩阵,Wt表示整个深度哈希网络的参数。
2.如权利要求1所述的基于虚拟标签回归的无监督跨模态哈希检索方法,其特征在于,采用迭代优化方法求解目标函数,利用反向传播和随机梯度下降算法更新网络参数,直至收敛。
3.如权利要求1所述的基于虚拟标签回归的无监督跨模态哈希检索方法,其特征在于,对于图像模态,采用VGG-16模型作为深度哈希网络模型,并使用在大规模ImageNet数据集上预先训练的权值对其进行初始化,卷积层和前两个全连接层构成特征表示部分,用于获取图像的深度特征,最后一个全连接层的神经元数目设置为哈希码长度,并选择双曲正切函数作为激活函数,得到深度网络的输出。
4.如权利要求1所述的基于虚拟标签回归的无监督跨模态哈希检索方法,其特征在于,对于文本模态,首先基于Bag-of-words模型提取文本特征,然后将文本特征传输到全连接层,前两个全连接层用于获取文本的深度特征,最后一个全连接层的神经元数目设置为哈希码长度,选择双曲正切函数作为激活函数,得到深度网络的输出。
5.如权利要求1所述的基于虚拟标签回归的无监督跨模态哈希检索方法,其特征在于,采用精度和平均精度作为检索评价指标,所述精度和平均精度值越大表示检索性能越好。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910823366.1/1.html,转载请声明来源钻瓜专利网。