[发明专利]多个查询修订模型的集成有效

专利信息
申请号: 201210596873.4 申请日: 2005-03-30
公开(公告)号: CN103136329B 公开(公告)日: 2016-11-02
发明(设计)人: D·R·贝利;A·J·巴特尔;B·A·戈梅斯;P·P·纳亚克 申请(专利权)人: 谷歌公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市金杜律师事务所 11256 代理人: 王茂华;黄倩
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 查询 修订 模型 集成
【说明书】:

相关申请的交叉引用

本申请是优先权日为2005年3月29日、国际申请日为2005年3月30日、国际申请号为PCT/US2005/010681、中国专利申请号为200580049822.8的专利申请的分案申请。

本发明涉及:

2003年9月22日提交的题为“System and Method for Providing Search Query Refinements”的美国专利申请系列号No.10/688,721;

2003年9月30日提交的题为“Method and Apparatus for Characterizing Documents Based on Clusters of Related Words”的美国申请系列号No.10/676,571;

2003年12月15日提交的题为“Large Scale Machine Learning Systems and Methods”的美国申请系列号No.10/734,584;

2004年6月28日提交的题为“Systems and Methods for Deriving and Using an Interaction Profile”的美国申请系列号No.10/878,926;

2004年7月26日提交的题为“Phrase Identification in an Information Retrieval System”的美国申请系列号No.10/900,021;

2005年3月28日提交的题为“Determining Query Terms of Little Significance”的美国申请系列号No.11/×××,×××;

2005年3月30日提交的题为“Determining Query Terms Synonyms Within Query Context”的美国申请系列号No.11/×××,×××;以及

美国专利No.6,285,999;

在此将以上申请中的每一个通过参考并入。

技术领域

本发明通常涉及信息检索系统,并且更具体地涉及用于修订用户查询的系统架构。

背景技术

信息检索系统(例如因特网搜索引擎)一般能够快速地提供通常与用户的查询相关的文档。搜索引擎可以使用词语和文档频率的各种统计量度,以及文档之间和词语之间的关联,以便确定文档与查询的相关性。大多数搜索引擎设计下的关键技术假设是用户查询准确地表示用户的期望的信息目标。

事实上,用户通常难以表示出良好的查询。单个查询经常不能提供期望的结果,并且用户频繁地输入关于同一主题的多个不同的查询。这些多个查询将通常地包括查询词语的宽度(breadth)和特征中的变化、猜测的实体名称、词序、词的数量等等的改变。因为不同的用户广泛地具有各种能力来成功地修订他们的查询,已经提出了各种自动的查询修订方法。

最通常地,查询精化(refinement)用于从较一般的查询中自动地生成较精确的(即较窄的)查询。当用户输入过宽的查询时,其前面的结果包括关于用户的信息需要的文档的超集,主要使用查询精化。例如,想要关于三菱格兰(Galant)汽车信息的用户可能输入查询“三菱”,该查询过于宽泛,因为其结果将包含许多不同的三菱公司,而不仅仅是汽车公司。由此,将期望对该查询精化(尽管在此是困难的,因为缺少用于确定用户的特定信息需要的附加上下文)。

然而,当用户输入过于具体的查询时,其中正确修订将加宽查询,或者当前面的结果与用户的信息需要不相关时,查询精化并不有用。例如,查询“三菱格兰(Galant)信息”可能因为词语“信息”而导致较差的结果(在这种情况下,关于三菱格兰(Galant)汽车的结果太少)。在这种情况下,正确修订用来加宽对“三菱格兰(Galant)”的查询。由此,尽管查询修订在某些情况下起作用,但是在很多情况下,需要通过使用其他查询修订技术来最好地满足用户的信息需要。

另一查询修订策略使用同义词列表或者词典以扩展查询,从而捕捉用户的潜在信息需要。然而,与查询精化一样,查询扩展不总是修订查询的适合方式,并且结果的质量非常依赖于查询词语的上下文。

因为在每个实例中没有一种查询修订技术可以提供期望的结果,所以期望具有一种方法,其提供多个不同的查询修订方法(或者策略)。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210596873.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top