[发明专利]一种对网络采集的域名数据进行筛选的方法及设备在审
申请号: | 201710599149.X | 申请日: | 2017-07-21 |
公开(公告)号: | CN107249049A | 公开(公告)日: | 2017-10-13 |
发明(设计)人: | 陈维;王钟;彭浩勇;贾士杨;罗干;廖艳云;易永波;林飞;毛俊;赵喜荣 | 申请(专利权)人: | 北京亚鸿世纪科技发展有限公司 |
主分类号: | H04L29/12 | 分类号: | H04L29/12 |
代理公司: | 北京辰权知识产权代理有限公司11619 | 代理人: | 董李欣 |
地址: | 100081 北京市海淀区学*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种对网络采集的域名数据进行筛选的方法及设备,所述方法包括从网络中获取至少包含域名与IP地址的对应关系的域名数据;对域名数据进行筛选,并且保存经筛选的域名数据,其中,筛选包括以下步骤中的至少一项剔除包含异常噪音域名的域名数据;剔除包含需进行IP纠错的域名的域名数据;剔除包含恶意泛域名的域名数据;剔除包含不存在的域名的域名数据;剔除包含不存活域名的域名数据;保留包含属于指定地域的IP地址的域名数据。实现了通过网络采集流量数据获得准确的域名数据。 | ||
搜索关键词: | 一种 网络 采集 域名 数据 进行 筛选 方法 设备 | ||
【主权项】:
一种对网络采集的域名数据进行筛选的方法,其特征在于,包括:步骤1:从网络中获取至少包含域名与IP地址的对应关系的域名数据;步骤2:对域名数据进行筛选,并且保存经筛选的域名数据,其中,筛选包括以下步骤中的至少一项:步骤2‑1:剔除包含异常噪音域名的域名数据,异常噪音域名至少包括非法域名、IP格式域名、IP端口格式域名;步骤2‑2:剔除包含需进行IP纠错的域名的域名数据,需进行IP纠错的域名为拨测的结果为114跳转、无法解析出对应的IP地址且没有提供实际访问内容的域名;步骤2‑3:剔除包含恶意泛域名的域名数据,恶意泛域名为不正规、量大且杂乱无章、鲜有内容展示、且没有进行统计的意义的域名;步骤2‑4:剔除包含不存在的域名的域名数据,不存在的域名为无法解析出接入IP地址、且通过拨测确定其不存在接入IP地址的域名;步骤2‑5:剔除包含不存活域名的域名数据,不存活域名为无法解析出接入IP地址、且通过拨测确定其存在接入IP地址、而通过进一步模拟HTTP/HTTPS请求并且确定其HTTP/HTTPS响应的状态码不正确的域名;步骤2‑6:保留包含属于指定地域的IP地址的域名数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京亚鸿世纪科技发展有限公司,未经北京亚鸿世纪科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710599149.X/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置