[发明专利]基于检索词歧义性和用户偏好的视频搜索方法无效
申请号: | 201110396519.2 | 申请日: | 2011-12-02 |
公开(公告)号: | CN102521321A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 金海;廖小飞;陆枫;贾旺喜 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 检索 歧义 用户 偏好 视频 搜索 方法 | ||
技术领域
本发明涉及互联网视频搜索领域,更具体地说,本发明涉及一种基于检索词歧义性和用户偏好的视频搜索方法。
背景技术
互联网的视频的数量迅猛增长,将视频进行分类的方法已经不能使用户快速找到用户所需要的视频。使用搜索的方法来定位用户所需的视频也成了必然。基于内容的视频搜索方法由于存在著名的语义鸿沟问题无法大规模应用,因此现有的大多数视频搜索的方法都是基于文本的视频搜索方法。
视频页面往往存在相关文本过短、链接关系不能直接反映页面权威度的问题。为此,传统的基于文本的视频搜索方法通过利用视频附加元数据(如视频时长、发布时间等)来提高搜索体验。这些方法需要过多的用户参与,而且无法针对具有不同偏好的用户来重排搜索结果。
重视个性化搜索对最终结果的影响会在一定程度上抑制其他因素对搜索结果的影响。而检索词往往具有歧义性,不同的检索词歧义性有所不同。对于歧义性比较小的检索词,并不适合做个性化搜索,如果对此类检索词做个性化搜索反而容易取得较差效果。
发明内容
本发明的目的在于提供一种基于检索词歧义性和用户偏好的视频搜索方法,其综合利用用户长期偏好描述信息和短期偏好描述信息来描述用户偏好、以检索词歧义性为参考来进行视频搜索的方法,最终提高用户的视频搜索体验。
本发明是通过以下技术方案实现的:
一种基于检索词的歧义性和用户偏好的视频搜索方法,包括以下步骤:获取视频,抽取视频的相关文本信息,为相关文本信息建立文本索引,抽取视频分类信息,并建立视频分类模型,输入检索词,查找文本索引,以得到相关文本信息与检索词对应的视频有序集合,根据检索词对应的点击记录生成检索词对应的歧义性描述信息,生成本次搜索会话中用户的短期偏好描述信息及长期偏好描述信息,并将短期偏好描述信息及长期偏好描述信息拟合成用户偏好描述信息,根据歧义性描述信息及用户偏好描述信息对视频有序集合中的视频重新排序,并输出排序后的视频有序集合,在用户从视频有序集合中选定视频后,更新检索词对应的点击记录,将用户识别号、检索词、本次搜索会话的识别号、选定的视频及其视频分类信息存入数据库,根据用户选定的视频更新用户的短期偏好描述信息和长期偏好描述信息。
抽取视频分类信息,并建立视频分类模型的步骤包括:抽取视频的分类字段文本,将分类字段文本归类到维度为n的视频分类空间之中的某一个分类i中,以建立视频的分类向量D={d0,d1,...,dj,...,dn-1},其中
根据检索词对应的点击记录生成检索词对应的歧义性描述信息的步骤是采用以下公式:其中,ClickEntroy(q)是检索词q对应的歧义性描述信息,W(q)是根据检索词q选中的所有视频集合,W(p|q)是根据检索词q选中的所有记录中所选视频属于第p类视频的记录所占的百分比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110396519.2/2.html,转载请声明来源钻瓜专利网。