[发明专利]一种基于谷歌浏览器插件的网页数据获取方法及系统在审

申请号：	201910583979.2	申请日：	2019-07-01
公开（公告）号：	CN110276041A	公开（公告）日：	2019-09-24
发明（设计）人：	姜敬超;徐宏伟;单震;宋设;杨照通	申请（专利权）人：	浪潮卓数大数据产业发展有限公司
主分类号：	G06F16/958	分类号：	G06F16/958;G06F3/0485;G06F9/445
代理公司：	济南信达专利事务所有限公司 37100	代理人：	姜明
地址：	214029 江苏省无锡市滨***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于谷歌浏览器插件的网页数据获取方法及系统，属于互联网数据获取技术领域。本发明的基于谷歌浏览器插件的网页数据获取方法包括以下步骤：S1、编写谷歌浏览器插件；S2、在编写的谷歌浏览器插件中填写对应的配置保证插件正常运行；S3、自动获取链接；S4、获取网页数据；S5、自动翻页；S6、自动拖滑块；S7、页面操作；S8、数据处理：从网页或文本中获取需要的数据，对网页或文本数据进行格式或处理。该发明的基于谷歌浏览器插件的网页数据获取方法能够降低被网站识别为爬虫的概率，具有很好的推广应用价值。
搜索关键词：	浏览器插件网页数据网页互联网数据网站识别文本数据页面操作自动翻页自动获取爬虫数据处理插件滑块链接文本概率配置保证
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于谷歌浏览器插件的网页数据获取方法，其特征在于：该方法包括以下步骤：S1、编写谷歌浏览器插件；S2、在编写的谷歌浏览器插件中填写对应的配置保证插件正常运行；S3、自动获取链接；S4、获取网页数据：首先判断网页是否加载完成，加载完成后获取加载后的网页数据；S5、自动翻页：在js中获取网页元素，模拟点击翻页按钮执行翻页操作；S6、自动拖滑块：获取验证码滑块的位置，模拟鼠标事件拖动滑块；S7、页面操作：在配置文件中写入参数，使用插件时页面配置从配置文件获取，打开页面根据需要选择详情页、列表页点击保存，刷新页面；S8、数据处理：从网页或文本中获取需要的数据，对网页或文本数据进行格式或处理。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司，未经浪潮卓数大数据产业发展有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910583979.2/，转载请声明来源钻瓜专利网。

上一篇：一种图片文件的处理方法、展示图片的方法及装置
下一篇：一种基于机器学习的智能Web代理缓存系统及方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于谷歌浏览器插件的网页数据获取方法及系统在审

专利文献下载