[发明专利]一种基于鲁棒监督的深度离散哈希跨模态检索方法及系统有效
申请号: | 201910246991.4 | 申请日: | 2019-03-29 |
公开(公告)号: | CN109960732B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 荆晓远;董西伟;吴飞;黄鹤;姚永芳;李云鹤 | 申请(专利权)人: | 广东石油化工学院 |
主分类号: | G06F16/432 | 分类号: | G06F16/432;G06N3/0464 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 |
地址: | 525000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 深度 离散 哈希跨模态 检索 方法 系统 | ||
1.一种基于鲁棒监督的深度离散哈希跨模态检索方法,其特点在于,所述基于鲁棒监督的深度离散哈希跨模态检索方法包括:对输入的图片或对应图片描述文本检索时,采用模态内和模态间一致性保持策略,同时进行非冗余特征选择;并选择具有最小冗余度的鲁棒性和鉴别性特征生成二进制哈希码;
再基于奇异值分解进行离散哈希学习;搜索出对应的图片或对应图片描述的文本;
所述基于鲁棒监督的深度离散哈希跨模态检索方法具体包括以下步骤:
步骤一:获取训练特征数据集,其中每个样本都由文本和图像对组成;
步骤二:对数据集里图像和文本分别进行特征学习;
步骤三:基于非冗余特征选择的深度哈希码学习;
步骤四:模态内加入一致性保持策略;
步骤五:模态间加入一致性保持策略;
步骤六:得到总目标函数并进行优化;
步骤二所述的对数据集里图像和文本分别进行特征学习的具体方法包括:
图像特征学习:利用一个7层的神经网络,前5层是卷积神经网络CNN,分别是第一层用96个大小为11*11的卷积核,步长是4,0边距,用Relu激活函数;池化用传统的2*2大小的模板做max pooling,最后局部归一化;第二层以第一层的输出作为输入,用256个5*5大小的卷积核,步长是1,padding是2,同样用Relu激活函数,2*2大小的max pooling,最后局部归一化;第三层、第四层和第五层相互连接,没有中间的池层或归一化层;第三和四层,用384个3*3的卷积核,步长是1,padding是1,第五层用256个3*3的卷积核,步长是1,padding是1;最大池层跟随第五层卷积的输出,得到尺寸为6×6×256的输出特征;第6层全连接层有4096个神经元,激活函数用Relu;得到与输入图像对应的尺寸为4096×1的特征;最后连接第7层全连接层,激活函数用双曲正切TanH;
文本特征学习:采用多层感知器MLP,由三个全连接层构成一个MLP DNN,用于将文本特征从原始特征空间映射到语义空间;利用relu作为前两个完全连通层的非线性激活函数;并以双曲正切Tanh作为最后一层的激活函数;文本的维数是d(t);
在步骤三中,基于非冗余特征选择的深度哈希码学习包括:对于第i个实例(vi,ti),表示学习到的图像特征,对应于图像模态的输出,其中θv为网络参数;
表示图像模态中n个训练实例的深度学习特征矩阵,其中第i个列向量为f(vi;θv);
表示学习到的文本特征,对应于文本模式的输出,其中θt为网络参数;表示文本模态中n个训练实例的深度学习特征矩阵,其中第i个列向量为g(ti;θt);
图像和文本模态中的第i个训练实例的投影深度学习特征和PtTg(ti;θt)分别在汉明空间中产生二值哈希码和和将深度学习特征f(vi;θv)和g(ti;θt)映射到潜空间的线性投影矩阵,(·)T是矩阵转置;
步骤三中,基于非冗余特征选择方法基于谱回归和2,1-范数正则化进行非冗余特征选择,对图像模态和文本模式进行特征选择,获得图像和文本模式中的实例的二进制哈希码:
其中γ1,γ2,γ3是权衡参数,1表示所有元素为1的向量,||·||F表示矩阵的F-范数,Z(v)和Z(t)分别是基于两个相似矩阵构造的两个矩阵;和是通过对相似矩阵进行奇异值分解SVD得到,其中和通过对相似矩阵进行奇异值分解(SVD)得到;用一组向量表示和和分别从图像模式和文本模式中选择鉴别特征和非冗余特征,生成二进制哈希码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东石油化工学院,未经广东石油化工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910246991.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法、设备及存储介质
- 下一篇:人物搜索系统