[发明专利]利用子查询自动生成查询建议无效
申请号: | 201180018778.X | 申请日: | 2011-03-31 |
公开(公告)号: | CN102859523A | 公开(公告)日: | 2013-01-02 |
发明(设计)人: | 陆建平;张东晖;H.S.K.万 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李静岚;汪扬 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 查询 自动 生成 建议 | ||
背景技术
像可在网络上获得的文档那样的庞大文档集合的关键词或查询搜索现在是常见的活动。随着搜索引擎越来越唾手可得,使用搜索技术的用户的数量增加了,并且这些用户搜索越来越广的主题。因此,许多用户在用户不熟悉的主题领域中进行许多搜索。这可能导致用户难以构想搜索查询。
在努力帮助用户的搜索技术中,有时提供查询建议作为对搜索查询的响应的一部分。查询建议向用户提供用户可以选择的可替代查询。这可以帮助用户识别可能更好地适用于找到感兴趣信息的其他搜索查询。
发明内容
在各种实施例中,可以通过识别所希望的子查询生成查询建议。可以累积搜索引擎数据来为各种查询确定使用特征。可以根据使用数据生成和排名潜在子查询。在对潜在子查询进行排名之后,当接收到搜索请求时,可以使用排名来选择子查询。可以将所选的子查询直接用作查询建议,或可以将子查询用作另一个查询建议引擎的输入。
提供本发明内容来以简化形式介绍下面在具体实施方式中进一步描述的概念的选择。本发明内容不旨在识别要求保护主题的关键特征或必要特征,也不是旨在用于孤立地帮助确定要求保护主题的范围。
附图说明
下面参考附图详细描述本发明,在附图中:
图1是用在实现本发明的实施例中的示范性计算环境的框图;
图2示意性地示出了适合执行本发明的实施例的系统;
图3描绘了按照本发明的实施例的方法的流程图;
图4描绘了按照本发明的实施例的方法的流程图;
图5描绘了按照本发明的实施例的方法的流程图;以及
图6和7描绘了根据使用汉语书面语言查询元素的本发明实施例的应用所得的结果。
具体实施方式
概况
在各种实施例中,提供了生成查询建议的系统和方法。查询建议的生成可以基于首先识别具有高排名的一个或多个子查询。可以将一个或多个高排名子查询用作查询建议,或可以将一个或多个子查询用作传统查询建议方法的输入。在一些实施例中,这些系统和方法可以用于基于像包含4到大约60个查询元素的查询那样的较长查询的查询建议。在其他实施例中,可以使用不需要人为干预的系统和方法自动生成查询建议。这些系统和方法也可以与用于语言的查询元素的性质无关地应用于各种语言。因此,这些系统和方法可以有效地应用于查询元素是单词的查询(像英语的查询那样),以及查询元素是字的查询(像汉语、日语或朝鲜语那样的查询)。
尽管向用户提供查询建议是传统做法,但提供高质量建议仍然存在许多障碍。一种这样的障碍是提供基于含有大量查询项的查询的查询建议。越来越多的搜索查询是包括4个或更多个关键词或查询元素的查询。项数增加的的一部分是使用“自然语言”查询的增加,其中查询是部分或甚至整个句子而不是关键词的集合。经验不足的用户更易于构想这样的长查询。长查询也可以用于进一步指定所希望搜索目标。当搜索庞大文档集合时,较长的查询可以有助于生成更相关排序的搜索结果。
虽然较长查询可以为搜索者带来好处,但提供所建议查询的传统方法对于长查询可能不那么有效。许多查询建议方法基于流行项的附加或相关项的替代。对于只有两个或三个查询元素的搜索查询,每个查询元素可以用作改变查询的基础而无需生成从中选择的选项的过大清单。但是,随着一个查询越来越长,变体的数量可以成指数增加,导致为了确定查询建议而评估的大量排列。
提供查询建议的另一个难题可能与跨越各种语言地提供查询建议有关。例如,查询建议算法使用自然语言查询的语法以便把重点放在最相关查询元素上。不幸的是,这种手段需要为使用的每种不同语言修改查询建议算法。由于像汉语那样的基于字书面语言的语法差异很大,所以这样的修改可能相当大。另外,即使在像英语那样的单一语言内,对于每个讲英语区域,语法的变体也可能需要不同的算法。
相关问题是对于查询建议需要人为干预或训练的任何搜索引擎所面临的难题。人为训练可以包括提供特殊方式对待的单词的词典,例如作出建议时可以忽略的单词,或应该关联的单词。人为训练还可以包括提供用于开发关联性的一组训练文档。不管训练的类型为何,对人为干预的需要将意味着对查询建议系统的更新将是不频繁和耗时的。这可能导致来自查询建议系统的建议是过时的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180018778.X/2.html,转载请声明来源钻瓜专利网。