[发明专利]视频搜索在审
申请号: | 201280070193.7 | 申请日: | 2012-02-27 |
公开(公告)号: | CN104106064A | 公开(公告)日: | 2014-10-15 |
发明(设计)人: | A.S.迪克西特;K.拉玛纳桑;Y.桑卡拉苏布拉玛尼亚姆;V.戈文达拉朱 | 申请(专利权)人: | 惠普发展公司;有限责任合伙企业 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 谢攀;徐红燕 |
地址: | 美国德*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 搜索 | ||
1.一种执行视频搜索的计算机实现的方法,包括:
分析搜索查询以识别第一组查询项;
使用第一组查询项来查询知识存储库,其中所述知识存储库是电子文档的集合;
识别对应于第一组查询项的电子文档;
解析电子文档以获得第二组查询项;
通过向查询项分配权重而对在第二组查询项中获得的查询项进行排序;以及
向视频搜索引擎提供位于前列的N个经排序的查询项。
2.根据权利要求1所述的方法,其中分析文本串搜索查询以识别第一组查询项,包括在文本串搜索查询中识别名词短语和焦点词,其中所述名词短语包括名词和专有名词,并且所述焦点词包括名词、专有名词、非无意义动词、形容词和数词。
3.根据权利要求1所述的方法,其中解析电子文档以获得第二组查询项包括:
获得存在于电子文档中的章节标题;
获得存在于电子文档中的子章节标题;
获得存在于电子文档中的超链接;以及
获得存在于电子文档中的名词短语,其中所述名词短语是未存在于电子文档的章节标题、子章节标题和超链接中的名词短语。
4.根据权利要求3所述的方法,还包括组合章节标题、子章节标题、超链接和所述名词短语以获得第二组查询项。
5.根据权利要求3所述的方法,还包括移除重复条目。
6.根据权利要求1所述的方法,其中向查询项分配权重,包括:
向存在于电子文档的子章节标题中的查询项分配比存在于电子文档的章节标题中的查询项相对更大的权重;
向存在于电子文档的超链接中的查询项分配比其它相对更大的权重;以及
识别与第二组查询项共享至少一个共同项的电子文档的那些章节和子章节标题,并且当识别出时,向存在于与电子文档的前述章节和子章节标题相关联的文本中的那些查询项分配相对更大的权重。
7.根据权利要求1所述的方法,其中识别对应于第一组查询项的电子文档包括识别其题目对应于第一组查询项的电子文档。
8.一种用于执行视频搜索的系统,包括:
用以获得视频搜索查询的用户接口;以及
处理器,其被编程为:
从视频搜索查询中识别出第一组查询项;
使用第一组查询项来查询知识存储库,其中所述知识存储库是电子文档的集合;
识别对应于第一组查询项的电子文档;
解析电子文档以获得第二组查询项;
通过向查询项分配权重而对在第二组查询项中获得的查询项进行排序;以及
向视频搜索引擎提供位于前列的N个经排序的查询项。
9.根据权利要求8所述的系统,其中识别第一组查询项包括在文本串搜索查询中识别名词短语和焦点词,其中所述名词短语包括名词和专有名词,并且所述焦点词包括名词、专用名词、非无意义动词、形容词和数词。
10.根据权利要求8所述的系统,其中解析电子文档以获得第二组查询项包括:
获得存在于电子文档中的章节标题;
获得存在于电子文档中的子章节标题;
获得存在于电子文档中的超链接;以及
获得存在于电子文档中的名词短语,其中所述名词短语是未存在于电子文档的章节标题、子章节标题和超链接中的名词短语。
11.根据权利要求8所述的系统,其中向查询项分配权重,包括:
向存在于电子文档的子章节标题中的查询项分配比存在于电子文档的章节标题中的查询项相对更大的权重;
向存在于电子文档的超链接中的查询项分配比其它相对更大的权重;以及
识别与第一组查询项共享至少一个共同项的电子文档的那些章节和子章节标题,并且当识别出时,向存在于与电子文档的前述章节和子章节标题相关联的文本中的那些查询项分配相对更大的权重。
12.根据权利要求8所述的系统,还包括显示由视频搜索引擎提供的视频搜索结果的显示屏。
13.根据权利要求8所述的系统,其中所述知识存储库是外部或内部存储库。
14.根据权利要求8所述的方法,其中所述搜索查询是文本输入或语音输入。
15.一种用于执行视频搜索的计算机程序产品,所述计算机程序产品包括:
具有以其包含的计算机可用程序代码的计算机可读储存介质,所述计算机可用程序代码包括:
分析搜索查询以识别第一组查询项的计算机可用程序代码;
使用第一组查询项来查询知识存储库的计算机可用程序代码,其中所述知识存储库是电子文档的集合;
识别对应于第一组查询项的电子文档的计算机可用程序代码;
解析电子文档以获得第二组查询项的计算机可用程序代码;
通过向查询项分配权重而对在第二组查询项中获得的查询项进行排序的计算机可用程序代码;以及
向视频搜索引擎提供位于前列的N个经排序的查询项的计算机可用程序代码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司;有限责任合伙企业,未经惠普发展公司;有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280070193.7/1.html,转载请声明来源钻瓜专利网。