[发明专利]基于互联网爬虫技术的互联网内容资源探测方法在审
申请号: | 201510575443.8 | 申请日: | 2015-09-11 |
公开(公告)号: | CN106528561A | 公开(公告)日: | 2017-03-22 |
发明(设计)人: | 施德群 | 申请(专利权)人: | 飞思达技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于互联网爬虫技术的互联网内容资源探测方法。本发明涉及内容资源探测子系统主要是通过对全网热点网站的深度探测和挖掘,获取相关信息,属于通信技术领域。本发明方法包括a)普通网站资源获取;b)基于ip地址的多站点调度机制的网站探测;c)脚本动态执行分析;d)提供全网资源探测的能力;e)通过不同第三方出口爬取资源的能力;f)资源管理平台子系统探测指令接收;g)普通网站的域名识别分析;h)对无法直接爬取的资源分析;i)对视频、音频类网站识别分析;j)对于下载类的网站识别分析;k)资源的归属情况分析;l)对网站调度的分析识别及系统输出;m)内容探测与质量测试结合。 | ||
搜索关键词: | 基于 互联网 爬虫 技术 内容 资源 探测 方法 | ||
【主权项】:
基于互联网爬虫技术的互联网内容资源探测方法,包括:a)普通网站资源获取b)基于ip地址的多站点调度机制的网站探测c)脚本动态执行分析d)提供全网资源探测的能力e)通过不同第三方出口爬取资源的能力f)资源管理平台子系统探测指令接收g)普通网站的域名识别分析h)对无法直接爬取的资源分析i)对视频、音频类网站识别分析j)对于下载类的网站识别分析k)资源的归属情况分析l)对网站调度的分析识别及系统输出m)内容探测与质量测试结合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞思达技术(北京)有限公司,未经飞思达技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510575443.8/,转载请声明来源钻瓜专利网。
- 上一篇:数据更新方法、用户设备、服务器及系统
- 下一篇:网络出站负载均衡方法及装置