[发明专利]一种域名存活性识别方法、装置及电子设备在审

专利信息
申请号: 201810900235.4 申请日: 2018-08-08
公开(公告)号: CN108900655A 公开(公告)日: 2018-11-27
发明(设计)人: 李博;金炫臻;赵毅 申请(专利权)人: 北京谷安天下科技有限公司
主分类号: H04L29/12 分类号: H04L29/12;H04L12/26
代理公司: 北京市广友专利事务所有限责任公司 11237 代理人: 祁献民
地址: 100086 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 存活性 记录集合 装置及电子设备 训练数据集 计算模型 记录 互联网技术 机器学习 数据清洗 域名信息 正确率 组数据 抽取 存活 丢弃 解析 清洗 计算机
【说明书】:

发明的实施例公开一种域名存活性识别方法、装置及电子设备,涉及计算机及互联网技术领域,能够解决只取一个月内的数据来判断域名存活性会导致实际存活但在一个月内无DNS解析记录域名信息数据被丢弃的问题。所述域名存活性识别方法包括:从DNS历史解析记录中抽取DNS解析记录,生成第一DNS解析记录集合;为第一DNS解析记录集合中的每条DNS解析记录增加域名存活性属性并设置其值;对第一DNS解析记录集合进行数据清洗;从清洗后的数据中提取4组数据,得到训练数据集;通过机器学习模块对训练数据集进行训练得到域名存活性计算模型;根据域名存活性计算模型判断待识别域名的存活性。本发明能够提高域名存活性识别的正确率。

技术领域

本发明涉及计算机及互联网技术领域,尤其涉及一种域名存活性识别方法、装置及电子设备。

背景技术

一个子域名生命周期是从打开服务到关闭服务。当一个子域名开启了服务,如果有解析就会被捕捉到对应的DNS解析数据,记为存活状态。当一个子域名关闭了服务,就不能被捕捉到对应的DNS解析数据,记为不存活状态。平台认为初次发现某个子域名的DNS解析时间默认为开启服务的时间,记为time_first,最后一次发现DNS解析的时间,记为time_last,此时间并非关闭服务的时间。

当前平台规则认定:如果某个子域名在一个月内无DNS解析记录,记为不存活状态,反之为存活。由于一个域名在其生命周期内会存有大量的子域名存活性数据,占用大量的存储空间,故而不能全部取用,目前只取一个月内的数据并认为是存活的数据(并非实际存活,会有少量误报)。因此会造成实际存活但在一个月内无DNS解析记录域名信息数据被丢弃。

发明内容

有鉴于此,本发明实施例提供一种域名存活性识别方法、装置及电子设备,能够解决只取一个月内的数据来判断域名存活性,导致实际存活但在一个月内无DNS解析记录域名信息数据被丢弃的问题,本发明能够利用一个月外实际存活的数据来识别域名存活性,提供了域名存活性识别的正确率。

第一方面,本发明实施例提供一种域名存活性识别方法,包括:

随机从数据库存储的DNS历史解析记录中抽取满足预设抽取条件且未开泛解析功能的域名的DNS解析记录,生成第一DNS解析记录集合;

为所述第一DNS解析记录集合中的每条DNS解析记录增加域名存活性属性;

测试所述第一DNS解析记录集合中的每条DNS解析记录的域名是否存活,并以测试结果作为对应DNS解析记录中的域名存活性属性值;

根据预定数据清洗策略对所述第一DNS解析记录集合进行数据清洗;

从清洗后的数据中提取4个指定参数对应的4组数据,得到训练数据集;

通过指定机器学习模块对所述训练数据集进行训练,得到域名存活性计算模型并存储;

根据所述域名存活性计算模型判断待识别域名的存活性。

结合第一方面,在第一方面的第一种实施方式中,每条DNS解析记录至少包括:域名、域名的最后解析时间、资源记录;

所述预设抽取条件包括:域名的最后解析时间与当前时间间隔大于预定时长,且资源记录为地址A记录或规范名字CNAME记录,同时域名不能与已经抽取的域名相同。

结合第一方面的第一种实施方式,在第一方面的第二种实施方式中,所述根据预定数据清洗策略对所述DNS解析记录集合进行数据清洗,包括:

提取所述第一DNS解析记录集合中每个域名的最新一条DNS解析记录,得到第二DNS解析记录集合;

删除所述第二DNS解析记录集合中主域名的DNS解析记录;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京谷安天下科技有限公司,未经北京谷安天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810900235.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top