[发明专利]一种网络爬虫模板的行为式生成方法在审
申请号: | 201410627310.6 | 申请日: | 2014-11-10 |
公开(公告)号: | CN104298783A | 公开(公告)日: | 2015-01-21 |
发明(设计)人: | 温杰;李牧;舒文静;高谞 | 申请(专利权)人: | 武汉安问科技发展有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 430074 湖北省武汉市关*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种网络爬虫模板的行为式生成方法,以操作者访问网络服务为入口,选取一个或多个网络服务作为训练库,通过采集操作者对网络服务操作的行为集合和网络服务交互数据,并分析其行为特征与网络服务结构特征的关联性,进而快速构建网络爬虫的模板。较之于传统手段,该方法不仅能快速生成通用模板,而且可进一步提升采用该通用模板的网络数据爬虫的整体效率、覆盖度和准确度。 | ||
搜索关键词: | 一种 网络 爬虫 模板 行为 生成 方法 | ||
【主权项】:
一种网络爬虫模板的行为式生成方法,其特征在于,包括以下步骤:1)操作者访问网络服务;2)选取一个或多个网络服务作为训练库,进行数据采集;3)对采集的数据进行特征关联;4)构建网络爬虫的通用模板。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉安问科技发展有限责任公司,未经武汉安问科技发展有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410627310.6/,转载请声明来源钻瓜专利网。
- 上一篇:集成触摸屏的液晶显示面板及液晶显示装置
- 下一篇:一种探针块及检测装置