[发明专利]一种基于局部关联图的跨媒体相似性度量方法和检索方法有效
申请号: | 201610029271.9 | 申请日: | 2016-01-15 |
公开(公告)号: | CN105701227B | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 彭宇新;黄鑫 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/43 | 分类号: | G06F16/43;G06F16/45 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 局部 关联 媒体 相似性 度量 方法 检索 | ||
1.一种基于局部关联图的跨媒体相似性度量方法,包括以下步骤:
(1)建立包含多种媒体类型的跨媒体数据集,对跨媒体数据集中的所有数据进行分块处理,在得到局部分块的同时保留其整体数据;
(2)对跨媒体数据集中每种媒体类型的整体数据和局部分块,都提取其特征向量;
(3)通过整体数据,利用跨媒体统一特征表示方法为不同媒体类型学习得到统一特征映射矩阵;
(4)根据统一特征映射矩阵,将不同媒体类型的整体数据与局部分块都映射到统一空间,在统一空间中构造局部关联图,根据该局部关联图计算媒体数据间的相似性;首先构建局部关联图,将不同媒体类型的整体数据与局部分块都映射到统一空间作为点集V,求出所有数据两两之间的欧氏距离来构造边集E,再将整体数据与整体数据、局部数据与局部数据之间的距离乘上一个小于1的系数α,显示相同粒度的相关性;然后在局部关联图中,计算两个媒体数据属于同一类别的概率作为相似性,最终的跨媒体相似性为整体数据相似性与局部分块相似性的和。
2.如权利要求1所述的方法,其特征在于,步骤(1)所述的多种媒体类型包括三种媒体类型:图像、文本和音频。
3.如权利要求1所述的方法,其特征在于,步骤(1)中的分块处理的方法为:图像使用3×3网格进行固定分块;文本将标点符号作为分隔符,每两个标点符号之间的部分作为一个局部分块;音频按照固定的时间长度进行分割。
4.如权利要求1所述的方法,其特征在于,步骤(2)中的特征向量具体为:文本数据是提取隐狄雷克雷分布特征向量;图像数据是提取词袋特征向量;音频数据是提取其梅尔频率倒谱系数特征向量。
5.如权利要求1所述的方法,其特征在于,步骤(3)中的统一特征映射矩阵学习方法,为现有的跨媒体统一特征表示学习方法,包括CCA、CFA以及其它以统一特征映射矩阵为学习目标的方法。
6.如权利要求1所述的方法,其特征在于,步骤(4)所述局部关联图的构造方式为:
a)令代表第r种媒体的第p个数据的统一特征表示,P(r)代表第r种媒体的统一特征映射矩阵,代表第r种媒体的第p个数据;设要求第r种媒体的第p个数据的统一特征表示,则由于在统一空间中已经不存在媒体类型的区别,在后面的公式中省略媒体类型r,仅用xp代表一个媒体数据,S(xp)代表其局部分块的集合;相应地,用yp代表其语义类别,op代表其统一特征表示,S(op)代表局部分块在统一空间中的点;
b)对于测试集中的每个数据op,以及S(op)中的每个数据si(op),分别定义局部关联图G={V,E};其中V,E的构造方法分别为:
V:令训练集的所有数据映射到统一空间后的点集合为Otr,其局部分块的集合为S(Otr),则V=Otr∪S(Otr)∪{op};
E:通过求出V中所有数据两两之间的欧氏距离来构造E,考虑到整体数据、局部数据在信息粒度上存在不同,将整体数据与整体数据、局部数据与局部数据之间的距离乘上一个小于1的系数α,从而显示这种相关性,即:
其中,dij为oi和oj的欧氏距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610029271.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:发光二极管的散热结构改良
- 下一篇:多媒体资源评估方法和装置