[发明专利]信息提供方法和信息提供设备无效
申请号: | 200710126876.0 | 申请日: | 2007-06-29 |
公开(公告)号: | CN101334779A | 公开(公告)日: | 2008-12-31 |
发明(设计)人: | 惠轶;苏中;孙伟;张阔 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 王茂华 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 提供 方法 设备 | ||
技术领域
本发明涉及信息技术领域,更具体地,本发明涉及一种信息提供方法和信息提供设备,它们可用于信息搜索。
背景技术
随着web 2.0的流行,为了能够向用户提供更好的web应用和web页面的体验,越来越多的web站点提供包含客户端脚本的网页,使得能够在例如Microsoft Internet Explorer浏览器的客户端上动态地产生内容。
但是,这些内容很难被搜索引擎搜索到并且对其进行索引。例如,一个服务器(web站点)提供如图7所示的HTML代码编写的网页。
对于上述网页,在例如IE、Firefox之类的客户端访问该服务器后,在其中将显示如下:
Hello,World
This is me
此外,当用户在客户端中点击了按钮之后,客户端将显示如下:
Hello,World
This is me
You click me
这里需要注意的是,当用户在客户端点击按钮后,客户端并不向服务器发送另一个请求,即可以获得点击按钮后的结果,这里是“You click me”。
然而,对于当前流行的大型搜索引擎(例如Google搜索引擎、Baidu搜索引擎、Yahoo搜索引擎等等)来说,在它们访问该服务器后,它们只抓取“Hello,World”和按钮并对其进行索引。对于其他内容,例如“This is me”和“You click me”,搜索引擎不能搜索到并对它们进行索引。
换句话说,搜索引擎,更具体地说,是搜索引擎的网络爬虫,在抓取期间只抓取网页中的静态内容,丢弃了网页中的客户端脚本,而不像普通客户端那样,执行上述HTML代码中的客户端脚本,生成“This is me”和“You click me”。
搜索引擎不能执行客户端脚本,并生成相应内容的主要原因如下:
1.有效性考虑。搜索引擎的网络爬虫每天需要处理上亿个网页,并且平均地,执行网页中的客户端脚本比仅仅解析网页要慢10-100倍,因此为了保证搜索引擎的处理速度,舍弃了客户端脚本的执行。
2.安全性考虑。允许在搜索引擎运行环境中执行网页中的客户端脚本将对搜索引擎带来很大的安全威胁。
3.维护客户端脚本上下文考虑。为了获得最高的效率,目前大多数搜索引擎包括几个独立的部分,分别用于处理不同的任务。例如,一个网络爬虫,用于取回网页,一个解析器,用于解析网页,一个或多个分析引擎,用于分析解析后的网页。很难在这些不同部分之间维护和转移实时执行客户端脚本后生成的内容。
4.客户端脚本执行顺序的不确定性考虑。通常,网页中的客户端脚本与客户端侧用户交互(例如,点击一个按钮,移动鼠标等)绑定。对于搜索引擎来说,不可能预测客户端脚本的执行顺序。此外,出于效率和安全方面的原因,以所有可能的顺序执行客户端脚本是搜索引擎难以接受的。
然而,从搜索引擎的角度和web内容提供者(服务器)的角度来说,非常迫切地希望搜索引擎能够搜索到执行客户端脚本后所生成的内容。
发明内容
本发明的一个目的是使搜索引擎能够在无需执行客户端脚本的情况下搜索到相应的内容。
根据本发明的第一方面,提出了一种信息提供方法,包括步骤:判定请求包括客户端脚本的初始网页的客户端是搜索引擎;执行所述客户端脚本以生成相应内容;构造包括所述内容的新网页;生成指向所述新网页的统一资源定位符(URL);以及把所述新网页连同所述统一资源定位符一起提供给所述搜索引擎。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710126876.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置