[发明专利]在诸如网站的网页的相关网页中传播有用信息有效
申请号: | 200780019223.0 | 申请日: | 2007-03-19 |
公开(公告)号: | CN101454748A | 公开(公告)日: | 2009-06-10 |
发明(设计)人: | 丹尼尔·艾尼奥;保罗·哈尔;凯文·拉克;约翰·兰平;阿米塔巴·K·辛哈尔;杨克 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G06F7/00 | 分类号: | G06F7/00 |
代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 张焕生;安 翔 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 诸如 网站 网页 相关 传播 有用 信息 | ||
§1.1技术领域
符合本发明的实施例涉及信息检索(IR)。具体地,符合本发明的实施例涉及改进诸如网页的文档的信息检索,所述文档属于诸如网站的多组文档中的一组。
§1.2背景技术
搜索引擎在帮助人们在万维网(“Web”)以及其它网络上找到感兴趣的信息方面已非常有用。在澳大利亚布里斯班举行的SeventhInternational World Wide Web Conference(第七届国际万维网会议)上S.Brin和L.Page发表的论文“Anatomy of a Large-Scale HypertextualSearch Engine(剖析大规模超文本搜索引擎)”和美国专利No.6,285,999中(两者在此均以引用的方式并入)描述了示例性搜索引擎。搜索引擎可以接收对搜索结果的查询。作为响应,搜索引擎可以(例如从网页的索引中)检索相关搜索结果。这样的搜索结果可以包括例如网页标题的列表、从这些网页中提取的文本的摘录以及指向这些网页的超文本链接,并且可以将所述搜索结果分组为预定数量(例如10)的搜索结果。
图1是可以包括网络(诸如因特网)160的环境100的上层框图,其中使用信息访问工具(facility)(客户端设备)110来呈现从一个或多个内容提供者(例如网页服务器)180处访问的信息。搜索工具(服务器)130可以被信息访问工具110使用来搜索感兴趣的内容。
信息访问工具110可以包括浏览操作112,其可以包括导航操作114和用户接口操作116。浏览操作112可以经由输入/输出接口操作118来访问网络160。例如,在个人计算机的情况中,浏览操作112可 以通过浏览器(诸如Mozilla公司的Firefox、美国在线时代华纳公司的Netscape、Opera软件公司的Opera、微软公司的Explorer等等)来执行,并且输入/输出接口操作可以通过调制解调器或网络接口卡(或NIC)和联网软件来执行。可能的信息访问工具110的其它示例包括诸如个人数字助理(PDA)和移动电话的无绳(untethered)设备、机顶盒、信息站(kiosk)、媒体播放器等等。
每一个内容提供者180可以包括存储资源(也称为内容)136、响应于请求访问并提供内容的资源检索操作184、以及输入/输出接口操作182。内容提供者180的这些操作可以由诸如个人计算机或服务器的计算机实现。因此,存储资源186可以具体化为存储在诸如磁盘、光盘等等的某种类型的存储介质上的数据。在该具体环境100中,术语“文档”可以被解释为包括诸如网页的可寻址内容。
搜索工具130可以执行爬行(crawl)、索引/排序以及查询处理功能。这些功能可以通过相同实体或单独实体来执行。此外,这些功能可以在同一位置处或在不同位置处执行。在任何情况下,在爬行工具150处,爬行操作152从经由网络160可访问的各种源获得内容,并且存储这样的内容或这样的内容的表格(form),如154所指示。然后,在自动索引/排序工具140处,自动索引/排序操作142可以访问存储内容154,并且可以生成内容索引(例如待在下面描述的倒序索引)和内容评级(例如待在下面描述的PageRank(页面排名))140。最后,查询处理操作134接受查询并且基于内容索引(以及内容评级)140返回查询结果。爬行、索引/排序以及查询处理功能可以通过一个或多个计算机来执行。
图2是高级搜索工具200的过程气泡图。在图2中示出的高级搜索工具200执行三个主要功能:(1)爬行;(2)索引/排序;以及(3)搜索。水平虚线将图2划分为对应于这三个主要功能的三个部分。更具体地,第一部分150’与爬行功能相对应、第二部分140’与索引/ 排序功能相对应以及第三部分134’与搜索(或查询处理)功能相对应(注意,在引用数字后的撇号“’”用于指示引用项仅是由没有撇号的该数字引用的项的一个示例)。这些部分的每一部分将在下面更详细地介绍。然而,在这样做之前,介绍了该高级搜索工具200的几个区别特征。该高级搜索工具使用Web的链接结构以及其它技术来改进搜索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780019223.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:盘装置
- 下一篇:具有动态色域映射的多基色显示