[发明专利]一种基于缺失多模态哈希的社交图像检索方法及系统有效
申请号: | 201911167754.5 | 申请日: | 2019-11-25 |
公开(公告)号: | CN111090765B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 朱磊;郑超群 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F16/58 | 分类号: | G06F16/58 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 缺失 多模态哈希 社交 图像 检索 方法 系统 | ||
1.一种基于无监督缺失多模态哈希的社交图像检索方法,其特征在于,包括以下步骤:
获取多模态检索数据,构造训练集、测试集和数据库集,每个样本均包括成对的图像和文本两个模态的数据,并对训练集、测试集和数据库集分别构造缺失数据集;
将训练集中的两个模态的原始数据分别输入到所构建的深度特征提取模型中进行多模态提取,将提取后的多模态特征利用高斯核函数映射到低维空间进行非线性特征表示;
根据非线性特征表示的训练集的多模态特征,构造训练集的基于无监督缺失多模态哈希的目标函数;
采用迭代求解算法求解上述目标函数,得到社交图像和文本的基矩阵与转换矩阵;
构造并利用在线模态缺失哈希的目标函数,根据计算得到的社交图像和文本的基矩阵与转换矩阵,获取测试集和数据库集中样本的哈希码,计算每个测试样本的哈希码与数据库集样本的哈希码之间的汉明距离,数据库集样本按其对应的汉明距离升序排序,得到检索结果;
基于无监督缺失多模态哈希的目标函数,具体为:
f1:
s.t.H=[Hc;H(1);H(2)],B=[Bc;B(1);B(2)]∈{-1,1}n×r;
在线模态缺失哈希的目标函数,具体为:
s.t.H=[Hc;H(1);H(2)],
其中,和是nc个完全成对的图像-文本对,是n1个缺失相应社交标签描述的社交图像,是n2个缺失图像的标签,d1和d2分别是图像和文本特征的维度,是单模态特征xi的高斯核函数,Hc是共享潜在表示,H(l)为独特潜在表示,H(1)和H(2)分别是图像和文本特征的独特潜在表示,U1和U2分别是社交图像和文本的基矩阵,W是转换矩阵,B是学习到的共享哈希码,μ1和μ2是动态权重,θ是平衡参数,λ是正则化参数,r是哈希码的长度,n是训练集中全部样本数量,Bc是图像-文本对对应的哈希码,B(1)是缺失的图像数据对应的哈希码,B(2)是缺失的文本数据对应的哈希码,Ul为基矩阵。
2.如权利要求1所述的基于无监督缺失多模态哈希的社交图像检索方法,其特征在于,对于社交图像模态,将其输入到VGG-16网络模型中,提取多维的图像特征;对于文本模态,将标签利用词袋模型提取多维的文本特征。
3.如权利要求1所述的基于无监督缺失多模态哈希的社交图像检索方法,其特征在于,将图像-文本对数据进行投影,得到共享潜在表示Hc,将仅存在于图像模态或标签模态中的缺失数据投射到各自的潜在语义空间中,得到独特潜在表示H(1)和H(2)。
4.如权利要求1所述的基于无监督缺失多模态哈希的社交图像检索方法,其特征在于,计算每个测试样本的哈希码与数据库集样本的哈希码之间的汉明距离,具体为:给定一个测试样本,计算该测试样本的哈希码跟数据库集中的所有样本的哈希码之间汉明距离,然后数据库集样本按照汉明距离排序,跟测试样本距离小的排在前面,距离大的排在后面,从而验证准确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911167754.5/1.html,转载请声明来源钻瓜专利网。