[发明专利]使用网络上的文档的偏离点击距离的排序函数无效
申请号: | 200680029645.1 | 申请日: | 2006-08-15 |
公开(公告)号: | CN101243435A | 公开(公告)日: | 2008-08-13 |
发明(设计)人: | D·梅耶左;H·扎拉格扎 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00;G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 张政权 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 网络 文档 偏离 点击 距离 排序 函数 | ||
背景
根据文档与给定搜索查询的相关性来对文档排序的排序函数是已知的。在本领域中继续努力开发为给定搜索查询提供比由搜索引擎使用已知排序函数生成的搜索结果更好的搜索结果的排序函数。
概述
在此所描述的特别地是用于确定网络上的给定文档的文档相关性得分的各种技术。文档相关性得分经由包括一个或多个查询无关组件的排序函数来生成,其中至少一个查询无关组件包括偏离点击距离(biased click distance)参数,该参数考虑了网络上的多个文档的偏离点击距离值。排序函数可以由搜索引擎用来基于多个文档的文档相关性得分按顺序(通常是降序)对多个文档排序。
提供本概述一般以简化的形式向读者介绍在“详细描述”一节中所描述的一个或多个选择概念。本概述并非旨在标识所要求保护的主题的关键和/或必需特征。
附图简述
图1表示示出响应于由用户输入的搜索查询产生已排序的搜索结果的方法的示例性步骤的示例性逻辑流程图;
图2是用于实现在此公开的方法和过程的示例性操作环境的一些主要组件的框图;
图3描述了标识网络空间中的文档、文档之间的链接、具有分配的偏离点击距离值的权威节点和具有计算的偏离点击距离值的非权威节点的的示例性网图;
图4A-4B表示示出为网图上的节点分配并生成偏离点击距离值的方法中的示例性步骤的逻辑流程图;
图5A-5B表示示出为网图上非权威节点生成偏离点击距离值的方法中的示例性步骤的逻辑流程图;以及
图6表示使用包含偏离点击距离值参数的排序函数来生成排序搜索结果的方法中的示例性步骤的逻辑流程图。
详细描述
为促进对在此所公开的方法和过程的原理的理解,使用以下的具体实施例的描述和特定语言来描述该具体实施例。然而应该理解,并不旨在通过使用特定语言来限制所公开的方法和过程的范围。所讨论的所公开的方法和过程的原理的改变、进一步的修改以及此类进一步的应用被认为通常是所公开的方法和过程所属的领域内的技术人员能想到的。
公开了为网络上的文档确定文档相关性得分的方法。使用包含一个或多个查询相关分量(例如,依赖于给定搜索查询或搜索查询项的细节的函数分量)的以及一个或多个查询无关组件(例如,不依赖于给定搜索查询或搜索查询项的函数分量)的排序函数来计算每个文档相关性得分。由排序函数确定的文档相关性得分可以被用来根据每一文档相关性得分对网络空间(例如,公司的内联网空间)中的文档排序。其中可使用所公开的方法的一个示例性搜索过程在图1中被示为示例性过程10。
图1描述示例性搜索过程10,它从处理步骤80开始,其中用户输入搜索查询。从步骤80,示例性搜索过程10前进到步骤200,其中搜索引擎搜索网络空间中的所有文档以得到该搜索查询的一个或多个项。从步骤200,示例性搜索过程10前进到步骤300,其中搜索引擎的排序函数基于每个文档的相关性得分对网络空间中的文档进行排序,该文档相关性得分基于一个或多个查询相关组件和一个或多个查询无关组件。从步骤300,示例性搜索10过程前进到步骤400,其中已排序的搜索结果通常以相关性的降序被呈现给用户,从而标识了网络空间里与搜索查询最相关的文档。
如在下面更详细讨论的那样,在确定文档相关性得分的某些示例性方法中,被用来确定文档相关性得分的排序函数的至少一个查询无关组件考虑了网络空间里的每个文档的“偏离点击距离”。在此被称为网络中的“权威文档(authoritativedocument)”或网图上的“权威节点”的特定文档的偏离点击距离可以被分配一初始点击距离值,以便把这些文档标识为相对于彼此有不同的重要程度,并且可能是相对于网络上的其余文档更高的重要程度。在此被称为网络中的“非权威文档”或网图上的“非权威节点”的其余文档具有基于这些文档相对于网络空间中最接近的权威节点(或网图上最接近的权威节点)的位置来计算的偏离点击距离值,得到向权威节点偏离的点击距离值。
在一个示例性实施例中,偏离点击距离值可以被分配给包括总共N个文档的网络上的m个权威文档,其中m大于或等于2且小于N。在这一示例性实施例中,系统管理员手动选择或搜索系统中的应用程序代码自动标识给定网络空间里在该网络空间中具有某一重要程度的m个权威文档。例如,m个权威文档的其中之一可以是网站的主页或直接链接到网站的主页的另一网页。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680029645.1/2.html,转载请声明来源钻瓜专利网。