[发明专利]一种二维跨媒体元搜索方法和系统有效
申请号: | 200910090902.8 | 申请日: | 2009-08-14 |
公开(公告)号: | CN101996191A | 公开(公告)日: | 2011-03-30 |
发明(设计)人: | 田永鸿;周志;黄铁军;高文 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 毛燕生 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种二维跨媒体元搜索方法和系统,属于信息检索领域。本发明的元搜索方法基于查询聚类和结果集交叠分析,通过对不同的子检索模型提供的检索结果集进行合并、加权等融合操作,最终获得单一的检索结果集。该元搜索方法包括:预处理阶段;查询分类阶段;检索执行阶段;融合阶段;以及,更新阶段。本发明所提供的跨媒体元搜索方法能同时利用类似查询在特征上的相似性、在检索结果融合模式上的相似性、以及不同子检索模型的检索结果集交叠特性等来有效改进检索性能,其检索性能优于单一维度的跨媒体搜索方法。 | ||
搜索关键词: | 一种 二维 媒体 搜索 方法 系统 | ||
【主权项】:
一种二维跨媒体元搜索方法,其特征在于,所述方法基于查询聚类和结果集交叠分析,包括:1)预处理阶段:对已有的部分查询数据进行标注,并将已标注的数据样本进行数据聚类,将相似的数据样本聚类到同一个簇中,学习每个簇中来自不同子检索模型的检索结果间的融合权重,得到簇的融合权重;2)查询分类阶段:给定新的查询请求,首先确定该查询与每个簇的距离或相似度,再计算该查询与每个簇的相关概率;3)检索执行阶段:对该查询请求,使用至少2个子检索模型分别进行检索,并分别获得相应的检索结果集;4)融合阶段:首先对各子检索模型的检索结果集进行交叠分析,计算所述检索结果集交叠情况下的融合权重;然后结合所述簇的融合权重和所述检索结果集的融合权重,获得对应于该查询请求的最终融合策略,输出融合后的检索结果集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910090902.8/,转载请声明来源钻瓜专利网。