[发明专利]一种网页信息处理方法及装置在审
申请号: | 202010298878.3 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111428115A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 何鲁敏;宋子杰 | 申请(专利权)人: | 行吟信息科技(上海)有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李金 |
地址: | 200025 上海市黄浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种网页信息处理方法及装置,主服务器将获取到的待抓取主题对应的网络资源数据存储到队列中,各个从服务器获取队列中的至少一个网络资源数据,向网络资源数据发送获取请求,接收与网络资源数据对应的网页信息,以实现至少通过各个从服务器抓取与网络资源数据对应的网页信息,从而提高网页信息的抓取效率。并且主服务器在待抓取主题对应的网络资源数据的存储时间达到过期时间后清空队列,以在队列中重新存储更新的待抓取主题对应的网络资源数据,实现对队列中的网络资源数据的定时更新,这样就可以基于变化后的网络资源数据抓取网页信息,实现增量获取网页信息,防止网页信息的重复获取。 | ||
搜索关键词: | 一种 网页 信息处理 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于行吟信息科技(上海)有限公司,未经行吟信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010298878.3/,转载请声明来源钻瓜专利网。