[发明专利]一种基于视频集合层级主题结构的检索结果聚类方法有效
申请号: | 201110316563.8 | 申请日: | 2011-10-18 |
公开(公告)号: | CN102332031A | 公开(公告)日: | 2012-01-25 |
发明(设计)人: | 徐常胜;桑基韬 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 梁爱荣 |
地址: | 100190 中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视频 集合 层级 主题 结构 检索 结果 方法 | ||
技术领域
本发明属于视频搜索技术领域,涉及一种基于视频集合层级主题结构的检索结果聚类方法。
背景技术
随着社会媒体(social media)的流行,互联网上的视频数量呈爆炸式增长,用户在享受丰富资源的同时也面临信息过载的困扰,如何将用户查询时所返回的成百上千的检索结果进行有效组织,帮助用户快速定位感兴趣的视频,已成为学术界和工业界共同关心的课题。比较常见的视频搜索引擎采用基于列表的浏览方式返回检索结果,使得用户只能顺序查找,冗长的列表式显示降低了用户体验,且不利于定位和查找感兴趣的目标视频;另外,该方式在某种程度上忽视了检索结果的多样性。基于对搜索结果进行聚类的浏览方式可以从多个方面描述检索结果,从而改善这一不足。
目前针对检索结果进行聚类的方法多专注于解决检索词的歧义性问题,通过对结果进行聚类来区分检索词的多个含义,比如“苹果”(apple),产生的聚类包括“苹果水果”(apple fruit)、“苹果电脑”(apple computer)、“苹果智能手机”(apple smartphone)等对“苹果”apple的不同解释。而还有很多情况,用户的检索词意义是明确的,并不存在歧义性问题,比如“北京奥运会”(Beijing Olympics)、“美国总统大选”(US president election)、“9/11袭击”(9-11attack),用户想了解的是关于这一搜索词的详细内容。针对这类情况,如果能挖掘出检索结果所包含的多个方面(facet),为用户提供一个基于聚类-层级的浏览方式,则可以帮助用户概要了解搜索结果所涉及的主题/方面,从而有助于用户逐步细化检索目标,准确定位感兴趣的视频。
在基于不同模态信息融合的视频聚类方法中,不同模态(文本信息:题目、标注、描述;视觉信息:颜色、边缘、纹理)被连成长向量,转换为一般的聚类问题,采用传统的标准割(Normalized Cut)或者信念传播(Affinity Propagation)作为聚类方法。该方法有如下两个问题:首先,在子主题聚类时没有将与搜索词关联的父主题单独考虑,容易将子主题与父主题相混;其次,对于视觉信息的利用不合理,文本和视觉信息应该分别进行建模。
发明内容
(一)要解决的技术问题
本发明的目的是提供能挖掘出检索结果所包含的多个方面,为用户提供一个基于聚类-层级的浏览方式,则可以帮助用户概要了解搜索结果所涉及的主题/方面,从而有助于用户逐步细化检索目标,准确定位感兴趣的视频,为此提出一种基于视频集合层级主题结构的检索结果聚类方法。
(二)技术方案
为实现上述目的,本发明提供基于视频集合层级主题结构的检索结果聚类方法包括步骤如下:
步骤S1:通过扩充相关的上位词、同义词以及语义关联词,对输入的搜索句子进行查询拓展,得到一个种子词集;
步骤S2:根据输入的搜索句子进行检索,返回一个视频集合,再对视频集合进行重复检测,得到每对视频的重复关系;
步骤S3:对得到的视频集合的内容进行层级主题建模,通过层级主题模型挖掘视频集合中潜在的层级主题关系;利用搜索句子与父主题的对应关系,将得到的种子词集作为监督信息,利用关联监督层级主题模型对得到的视频集合内容进行建模;并将视频进行重复检测的每对视频的重复关系作为约束,通过关联监督层级主题模型进行建模,实现基于关联监督层级主题模型的主题树发现和视频聚类。
优选实施例,所述查询拓展包含基于词网(WordNet)的查询拓展,以及基于关联规则的查询拓展,将与搜索句子相关的词汇扩充到主题树的父主题中。
优选实施例,所述基于词网(WordNet)的查询拓展是将词网(WordNet)概念树中的上位词和同义词作为扩充词,填加入种子词集。
优选实施例,所述基于关联规则的查询拓展为弥补词网(WordNet)领域词汇的狭义性,进一步将视频集合的文本元数据中具有最大置信度和支持度的词汇作为扩充词,填加入种子词集。
优选实施例,所述重复检测是根据视频边缘和纹理的局部特征索引对抽样得到的代表某个视频片段的关键帧进行匹配;利用时空一致性信息滤除匹配噪声,并归一化得到视频层的匹配分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110316563.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高压N型结型场效应晶体管及其制造方法
- 下一篇:热敏电阻特性演示仪