[发明专利]基于专业搜索引擎的爬虫策略获取图书信息的方法无效
申请号: | 201310535962.2 | 申请日: | 2013-10-31 |
公开(公告)号: | CN104598493A | 公开(公告)日: | 2015-05-06 |
发明(设计)人: | 张宇 | 申请(专利权)人: | 大连易维立方技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 无 | 代理人: | 无 |
地址: | 116000 辽宁省大连市*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于专业搜索引擎的爬虫策略获取图书信息的方法,其特征在于包括如下步骤:1)图书信息收索服务器通过有线或无线的方式连接到各图书网站上;2)图书信息收索服务器中存储有对应网站的数字许可证书;3)图书网站校验通过后,图书信息收索服务器通过专业搜索引擎的爬虫策略略对图书网站中的更新图书信息进行搜索,图书信息收索服务器便对更新的图书信息进行下载,下载的更新图书信息经过防火墙和数据过滤器后存入图书信息收索服务器本地存储器中;4)图书信息收索服务器对存储如本地存储器的图书信息进行编译,然后发送到图书源数据库中。本发明提供的方法具有:使用方便、处理速度、技术实现容易等特点。 | ||
搜索关键词: | 基于 专业 搜索引擎 爬虫 策略 获取 图书 信息 方法 | ||
【主权项】:
一种基于专业搜索引擎的爬虫策略获取图书信息的方法,其特征在于包括如下步骤:1)图书信息收索服务器通过有线或无线的方式连接到各图书网站上;2)图书信息收索服务器中存储有对应网站的数字许可证书,在图书信息收索服务器登陆到上述网站后,自动匹配数字证书供网站校验;3)图书网站校验通过后,图书信息收索服务器通过专业搜索引擎的爬虫策略略对图书网站中的更新图书信息进行搜索,一旦搜索到图书更新信息后,图书信息收索服务器便对更新的图书信息进行下载,下载的更新图书信息经过防火墙和数据过滤器后存入图书信息收索服务器本地存储器中;4)图书信息收索服务器对存储如本地存储器的图书信息进行编译,然后发送到图书源数据库中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连易维立方技术有限公司;,未经大连易维立方技术有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310535962.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种手机数据管理系统
- 下一篇:基于宽度优先搜索策略获取图书信息的方法