[发明专利]基于相关保持映射和一分类器的图像视频搜索排序方法有效

专利信息
申请号: 201210594857.1 申请日: 2012-12-31
公开(公告)号: CN103049570A 公开(公告)日: 2013-04-17
发明(设计)人: 冀中;苏育挺;井佩光 申请(专利权)人: 天津大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 温国林
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 相关 保持 映射 分类 图像 视频 搜索 排序 方法
【说明书】:

技术领域

发明涉及面向多媒体信息检索领域,特别涉及基于相关保持映射和一分类器的图像视频搜索排序方法。

背景技术

随着网络上图像、视频等资源的日益丰富,从海量数据中快速准确地获取用户所需的信息已经越来越重要。基于内容的图像或视频检索是指通过对图像或视频内容进行分析提取图像或视频的视觉特征,从特定数据库或网络中查找到具有指定特征或含有特定内容的图像或视频。但由于基于内容的图像或视频检索方法存在着计算量大,计算复杂度高,占用更多的存储空间等不足,因此很难在网络检索中获得实质应用。图像或视频搜索排序技术是利用视觉信息改进初始查询结果的过程,可以很好的解决上述问题。

图像或视频搜索排序应用中存在着大量排序信息。排序信息包括数据的相关性等级信息、数据的优先级关系信息以及建立其之上的关系对、关系序列等信息。利用标注信息进行图像或视频排序是目前主要的方法之一,标注信息的获取可以通过相关反馈、伪相关反馈和隐相关反馈等途径。其中,相关性等级信息广泛应用于信息检索中的模型训练中。在大多数情况下,根据与查询的相关性的高低手动地或自动地对每个文档进行不同相关性等级的标注,例如“非常相关”、“一般相关”和“不相关”等。

样本的相关性等级信息不同于传统的类标号信息,前者是在信息检索中用来衡量文档与查询之间相关程度的度量,后者指的是机器学习与模式识别领域中一类事物所共同具有的属性。例如在传统的模式分类任务中,同一类的事物会具有共同的特征,不同类的事物具有不同的特征。然而,在排序应用中,由于样本按照与查询相关的程度分为不同的相关性等级,这样即使不同相关性等级的样本之间,也可能由于与查询相关而存在不同程度的相关性,此外具有相同的相关性等级样本之间,由于相关性等级的不同也会具有不同程度的相关性或者不具有相关性。因此并不能直接将样本的相关性等级信息作为样本的类别标号信息对样本进行处理。

发明人在实现本发明的过程中,发现现有图像/视频的搜索排序技术中存在以下问题:

图像或视频搜索排序中需要对图像或视频提取视觉特征,视觉特征具有高维特性。样本的类别标号不等同于样本的相关性等级信息,传统的维数约简算法往往是针对分类任务提出的,而分类任务与排序任务并不相同,因此直接应用于图像或视频搜索排序中并不合理。

图像或视频搜索排序中的样本数据与查询主题存在着不同程度的相关性,样本数据之间也存在着不同程度的相关性,而数据之间的这种复杂关系用超球体分布的形式可以很好的描述。超球体内是与查询最相关的样本,靠近球体的位置是与查询一般相关的样本,最外面则是与查询不相关的样本。一方面,目前并没有能解决这种数据分布的维数约简方法。另一方面,传统的图像或视频的搜索排序方法设计中并没有考虑到数据呈现超球形分布这一特点。不同于传统的一分器SVDD(Support Vector Data Description),SVDD是利用核变换的思想将样本映射到高维空间里,认为其在未知的高维空间中目标样本是具有超球体分布。因为核变换具有不可控性及未知性,在实际中很难操作。

发明内容

本发明提供了基于相关保持映射和一分类器的图像视频搜索排序方法,本发明减少了用户标注负担,提高了检索性能,提升用户的搜索体验,详见下文描述:

基于相关保持映射和一分类器的图像视频搜索排序方法,所述方法包括以下步骤:

(1)通过人工标注或自动标注从样本的特征向量集合中选择若干个与查询最相关的样本及与查询不相关的样本,组成训练样本集合;

(2)利用所述训练样本集合,作为基于超球体分布的维数约简模块的输入,获取维数约简模型;

(3)利用所述维数约简模型对所有样本及训练样本集合进行变换,得到维数约简后的所有样本新特征矩阵及训练样本新特征矩阵

(4)利用所述训练样本新特征矩阵中与查询最相关的样本作为基于一分类器的排序学习模型的输入,训练得到排序模型f(t);

(5)将所述所有样本新特征矩阵中的任意一个样本ti作为所述排序模型f(t)的输入,由大到小排列输出所有样本排序后的结果。

在步骤(1)之前所述本方法还包括:

1)获取图像或视频数据;2)对所述基于文本的搜索结果提取视觉特征获取所有样本的特征向量集合。

所述利用所述训练样本集合,作为基于超球体分布的维数约简模块的输入,获取维数约简模型具体包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210594857.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top