[发明专利]多标签核化典型相关分析检索方法有效
申请号: | 201710158859.9 | 申请日: | 2017-03-17 |
公开(公告)号: | CN106951509B | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 白亮;贾玉华;王昊冉;郭金林;谢毓湘;于天元 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F16/44 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 陆薇薇 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于计算机检索技术领域,具体涉及一种多标签核化典型相关分析检索方法。主要步骤为:(S1)选择文本和视觉图像,构建文本、视觉图像和标签的配对数据,并选择配对数据的样本;(S2)计算标签的语义相似性矩阵;(S3)将语义相似性矩阵应用于核化典型相关分析来求取多模态共享子空间;(S4)分别求取视觉图像与文本在多模态共享子空间投影表示;(S5)进行检索,获取跨模态子空间的检索结果。本发明通过对多媒体文档中多标签形式的高层语义信息加以利用同时应用KCCA来挖掘不同模态之间非线性的相关关系,学习到了更适合于跨模态检索任务的不同模态的更具有区分性的公共子空间,得到了很好的检索效果。 | ||
搜索关键词: | 标签 典型 相关 分析 检索 方法 | ||
【主权项】:
1.一种多标签核化典型相关分析检索方法,其特征在于,包括以下步骤:(S1)选择文本和视觉图像,构建文本、视觉图像和标签的配对数据,并选择配对数据的样本;配对数据的样本表示为{(t1,p1,z1),...,(ti,pi,zi),...,(tN,pN,zN)},其中zi是配对数据的第i个样本的标签向量,Tw=[t1,t2,...,tN]∈Rdt×N,Tw是文本样本的矩阵表示,dt是文本样本的维度,P=[p1,p2,...,pN]∈Rdp×N,P是视觉图像样本的矩阵表示,dp表示视觉图像样本的维度;Z=[z1,z2,...,zN]∈RC×N,其中Z表示标签矩阵,C为标签的维度,N为配对数据的样本数;(S2)计算标签的语义相似性矩阵;设f(g)为计算任意两个标签向量之间相似性的函数,则语义相似性矩阵S:
(S3)将语义相似性矩阵应用于核化典型相关分析来求取多模态共享子空间;为获取学习共同的多模态共享子空间,将ml‑KCCA公式化为:
其中,ρ为相关系数,
Kt和Kp分别表示N对样本的N×N核矩阵,η用于控制语义相似性矩阵的影响系数,α,β表示投影向量;根据
和
将求解α,β过程转化为求解特征值问题如下:B‑1Aw=λw (4)其中,λ为特征值,
w=[α β]T,根据值最大的D个特征值,求出对应的一系列的向量(α1,β1),...,(αD,βD);根据(α1,β1),...,(αD,βD),将新的文本输入tx投影到α指定的单个文本输入上:
其中αi表示向量α的第i个元素,ti代表N个样本数据中的第i个样本,φt表示数据空间到特征空间的映射函数,kt表示特征空间的核函数;(S4)分别求取视觉图像与文本在多模态共享子空间的投影表示;新的文本tx到D维公共子空间的最终投影M为:
新视觉图像px到D维公共子空间的最终投影Q为:
(S5)进行检索,获取跨模态子空间的检索结果,具体为:进行图像检索文本时,则通过将新视觉图像通过Q映射到子空间,进而进行相似性检索;进行文本检索视觉图像时,则将文本通过M映射到子空间,进而进行相似性检索。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710158859.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种钢铁冶炼用废料处理装置
- 下一篇:城市建筑固体垃圾处理用破碎机