[发明专利]一种跨模态哈希检索方法、终端设备及存储介质有效
申请号: | 202011289807.3 | 申请日: | 2020-11-17 |
公开(公告)号: | CN112364198B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 曹文明;冯文铄;曹桂涛 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/383;G06F16/31;G06F16/35;G06F16/51;G06F16/55;G06V10/44;G06V10/82;G06N3/048;G06N3/084 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 冷仔 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 跨模态哈希 检索 方法 终端设备 存储 介质 | ||
1.一种跨模态哈希检索方法,其特征在于,包括:
通过深度神经网络生成真实图像数据的真实图像哈希码和真实文本数据的真实文本哈希码;
根据所述真实图像数据和所述真实文本数据之间的共有标签,获取相似性度量;
根据所述真实图像哈希码、所述真实文本哈希码以及所述相似性度量进行模态间损失优化和模态内损失优化,以更新所述深度神经网络的参数并生成公共哈希码;
将更新参数后的所述深度神经网络生成的新真实图像哈希码输入第一生成器,将所述真实文本哈希码输入第一鉴别器,根据所述第一鉴别器输出的第一鉴别结果更新所述第一生成器的网络参数;
将更新参数后的所述深度神经网络生成的新真实文本哈希码输入第二生成器,将所述真实图像哈希码输入第二鉴别器,根据所述第二鉴别器输出的第二鉴别结果更新所述第二生成器的网络参数;
所述模态间损失优化的目标函数的表达式如下:
其中,H表示缺省的哈希码,θx表示所述深度神经网络中与所述真实图像相关的参数,x表示所述真实图像,θy表示所述深度神经网络中与所述真实文本相关的参数,y表示所述真实文本,C1表示所述模态间损失的损失项,n表示样本的数量,i表示所述真实图像的计数序号,j表示所述真实文本的计数序号,Sij表示相似矩阵,表示所述相似矩阵的内积,P表示所述n个样本的新真实图像哈希码向量,T表示n个样本的新真实文本哈希码向量,||·||F表示F范数,所述模态间损失优化的目标函数的第一项使用负对数似然函数作为模态间相似性度量,1表示单位矩阵;
所述模态内损失优化的目标函数的表达式如下:
其中,C2表示所述模态内损失的损失项,所述目标函数的第一项使用负对数似然函数作为所述真实图像数据的模态内相似性度量,所述模态内损失优化的第一项使用负对数似然函数作为所述真实图像数据的模态内相似性度量,所述模态内损失优化的目标函数的第二项使用负对数似然函数作为所述真实文本数据的模态内相似性度量;
所述公共哈希码的表达式如下:
H’=sign(P+T);
其中,H’表示公共哈希码,sign()表示符号函数;
所述第一鉴别器的梯度表达式如下:
所述第一生成器的梯度表达式如下:
其中,▽θd1表示所述第一鉴别器的梯度,表示所述真实文本哈希码,D1()表示所述第一鉴别器鉴别图像为真的概率,G(Hx)表示所述第一生成器生成的虚拟图像哈希码,Hx表示所述新真实图像哈希码,▽θg1表示所述第一生成器的梯度,sign()表示符号函数,表示所述n个样本的真实文本哈希码向量,P表示所述n个样本的新真实图像哈希码向量;
所述第二鉴别器的梯度表达式如下:
所述第二生成器的梯度表达式如下:
其中,▽θd2表示所述第二鉴别器的梯度,表示所述真实图像哈希码,D2()表示所述第二鉴别器鉴别图像为真的概率,G(Hy)表示所述第二生成器生成的虚拟文本哈希码,Hy表示所述新真实文本哈希码,▽θg2表示所述第二生成器的梯度,表示所述n个样本的真实图像哈希码向量,T表示所述n个样本的新真实文本哈希码向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011289807.3/1.html,转载请声明来源钻瓜专利网。