[发明专利]网页快照的生成方法及装置有效

专利信息
申请号: 201610104459.5 申请日: 2016-02-25
公开(公告)号: CN105787032B 公开(公告)日: 2019-03-29
发明(设计)人: 熊正祥 申请(专利权)人: 广州神马移动信息科技有限公司
主分类号: G06F16/958 分类号: G06F16/958
代理公司: 北京超凡志成知识产权代理事务所(普通合伙) 11371 代理人: 吴开磊
地址: 510627 广东省广州市天河区黄埔大*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网页快照 生成 方法 装置
【说明书】:

发明公开了一种网页快照的生成方法及装置,所述方法包括:在按照关键字搜索到网页资源之后,获取所述网页资源对应的网页内容;从所述网页内容所包含的所述关键字中筛选未添加链接的关键字;按照预设规则为所述未添加链接的关键字添加链接,得到所述网页资源对应的网页快照。本发明还提供了一种网页快照的生成装置。本发明的技术方案,在网页内容中增加链接资源入口的同时,还能够保证添加链接后网页内容对应的程序结构和格式正确,确保程序的正常运行和网页内容显示时排版正确,从而能够大大的提高用户体验。

技术领域

本发明涉及互联网技术领域,更具体而言,涉及一种网页快照的生成方法及装置。

背景技术

为了能够及时、快速的查看所搜索的网页内容,搜索引擎根据用户输入的搜索信息搜索到网页资源之后,通常将网页资源对应的内容进行抓取,并处理成纯文本的网页内容,然后,将处理后得到的纯文本网页内容存储到搜索引擎的缓存中。相关技术中,将所缓存的纯文本网页内容称为网页快照。当网速不稳定或者搜索到的网页资源发生变化,导致无法正常打开搜索到的网页资源时,用户可以通过网页快照访问所缓存的纯文本网页内容。

需要说明的是,为了提高搜索到的网页资源的定向匹配精确度,提高搜索效率,搜索引擎在接收用户输入的搜索信息之后,可以首先从搜索信息中提取出最能概括用户查找内容的关键字,并将所提取的关键字作为主要索引信息进行网页资源搜索。由于关键字是搜索信息的概括化和集中化查询词,因此,为了增加链接的资源入口,相关技术中,可以为网页快照中所包含的所有关键字添加相应超链接,以便于用户能够通过网页快照中的任意关键字访问其他相关资源。

然而,由于网页快照对应的网页内容包含已添加超链接的语句和词汇,而已添加超链接的语句和词汇中可能包含关键字,而且,搜索引擎在生成网页快照时,通常仅将网页资源对应的内容处理成纯文本网页内容,对网页内容中的超链接不进行处理,因此,如果为所有关键字添加超链接,网页快照中将存在部分添加有两次超链接的关键字,不仅会造成程序结构和格式的混乱,导致程序运行时易产生错误,而且还会造成网页快照在显示时排版错乱,导致用户体验不好。

发明内容

有鉴于此,本发明实施例提供了一种网页快照的生成方法及装置,能够解决相关技术中存在的程序运行易产生错误,且网页快照在显示时排版错乱的问题。

第一方面,本发明实施例提供了一种网页快照的生成方法,包括:在按照关键字搜索到网页资源之后,获取所述网页资源对应的网页内容;从所述网页内容所包含的所述关键字中筛选未添加链接的关键字;按照预设规则为所述未添加链接的关键字添加链接,得到所述网页资源对应的网页快照。

在第一方面的第一种可能的实现方式中,所述从所述网页内容所包含的所述关键字中筛选未添加链接的关键字,包括:获取所述网页内容中已添加链接的文本的区域标识和所述关键字的区域标识;根据所述区域标识将区域不属于所述已添加链接的文本区域的关键字确定为未添加链接的关键字。

结合上述第一方面,在第二种可能的实现方式中,所述获取所述网页内容中已添加链接的文本的区域标识,包括:从所述网页内容的源代码中顺次选择符合第一预设规则的每组第一起始字符和第一结束字符;分别记录所述每组第一起始字符和第一结束字符在所述源代码中对应的顺序号,作为每段所述已添加链接的文本的区域标识。

结合上述第一方面,在第三种可能的实现方式中,所述获取所述网页内容中所述关键字的区域标识,包括:从所述网页内容的源代码中顺次选择符合第二预设规则的每组第二起始字符和第二结束字符;分别记录所述每组第二起始字符和第二结束字符在所述源代码中对应的顺序号,作为每组所述关键字的区域标识。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州神马移动信息科技有限公司,未经广州神马移动信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610104459.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top