[发明专利]用于搜索结果的语义目录有效

专利信息
申请号: 201180008423.2 申请日: 2011-01-19
公开(公告)号: CN102725759A 公开(公告)日: 2012-10-10
发明(设计)人: V.瓦拉马尼;A.斯里瓦斯塔瓦;T.纳姆;A.C.苏伦德兰 申请(专利权)人: 微软公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 董宁;汪扬
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 搜索 结果 语义 目录
【权利要求书】:

1. 一种或多种存储计算机可用指令的计算机可读的媒体,当一个或多个计算设备使用所述指令时,使所述一个或多个计算设备执行方法,该方法包括:

接收搜索查询;

使用所述搜索查询进行搜索;

从搜索中接收多个文档片段;

通过将一个或多个文档片段与主题的本体进行比较,识别一个或多个候选主题的第一集合;

通过将一个或多个文档片段与部分主题的本体进行比较,识别一个或多个候选主题的第二集合;

通过从一个或多个文档片段生成关键短语主题,识别一个或多个候选主题的第三集合;

对来自所述第一、第二、第三候选主题集合中的候选主题进行排名;

基于对候选主题的排名选择一个或多个主题;

提供搜索结果页面以响应于所述搜索查询,该搜索结果页面具有包含所述一个或多个主题的目录,以及用于呈现一个或多个搜索结果的搜索结果区域。

2. 如权利要求1所述的一种或多种计算机可读的媒体,其中通过将一个或多个文档片段与部分主题的本体进行比较来识别一个或多个候选主题的所述第二集合包括识别一个或多个部分主题并命名每个部分主题,其中所述部分主题通过以下操作命名:

在一个或多个文档片段中识别所述部分主题的部分主题标识符单词的出现;

提取所述一个或多个文档片段中围绕所识别的所述部分主题标识符单词的出现而出现的单词和/或短语;

对每个提取的单词和/或短语的频率进行计数;

选择频率最高的单词或短语;以及

使用所述部分主题标识符和所述使用频率最高的单词或短语对所述部分主题进行命名。

3. 如权利要求1所述的一种或多种计算机可读的媒体,其中通过从一个或多个文档片段生成关键短语主题来识别一个或多个候选主题的所述第三集合包括通过以下操作从文档集合中剩余的文档片段计算独立关键短语:

从一个或多个文档片段生成候选关键短语;

评估候选关键短语的独立性;

合并相互依赖的候选关键短语;以及

为每组合并的相互依赖的关键短语识别频率最高的候选关键短语。

4. 如权利要求1所述的一种或多种计算机可读的媒体,其中对候选主题排名基于选自如下中的一项或多项:分配给候选主题的文档总数、分配给候选主题的每个文档的排名、分配给主题的经过选择的文档的排名以及候选主题的单词长度。

5. 一种或多种存储计算机可用指令的计算机可读的媒体,当一个或多个计算设备使用这些指令时,使得所述一个或多个计算设备执行一种方法,该方法包括:

接收搜索查询;

确定所述搜索查询的本体映射是否存在;

如果所述搜索查询的本体映射存在,基于所述本体映射检索第一主题集合,并将所述第一主题集合添加到主题列表中;

使用所述搜索查询进行搜索以获得多个搜索结果,每个搜索结果与文档片段相对应;

接收至少部分文档片段作为文档集合以用于进一步分析;

将文档集合中的每个文档片段与主题的本体进行比较;

对于其中确定肯定的主题识别的每个文档片段,将所述文档片段分配给相应的主题,并从所述文档集合中移除所述文档片段;

将至少一个从主题本体识别出的主题添加到所述主题列表;

将所述文档集合中剩余的每个文档片段与部分主题的本体进行比较;

对于其中确定肯定的部分主题识别的每个文档片段,将所述文档片段分配给相应的部分主题,并从文档集合中移除所述文档片段;

对至少一个具有一个或多个被分配的文档片段的部分主题进行命名;

将至少一个命名的部分主题添加到所述主题列表;

根据所述文档集合中剩余的文档片段计算独立关键短语;

将文档分配给独立关键短语;

识别至少一个独立关键短语主题;

将所述至少一个关键短语主题添加到所述主题列表;

对所述主题列表中的主题进行排名;

基于排名选择主题;

使用所述选择的主题生成目录;以及

提供搜索结果页面以响应于所述搜索查询,所述搜索结果页面包括所述目录以及用于呈现搜索结果的搜索结果区域。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201180008423.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top