[发明专利]一种域名存活性识别方法、装置及电子设备在审
申请号: | 201810900235.4 | 申请日: | 2018-08-08 |
公开(公告)号: | CN108900655A | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 李博;金炫臻;赵毅 | 申请(专利权)人: | 北京谷安天下科技有限公司 |
主分类号: | H04L29/12 | 分类号: | H04L29/12;H04L12/26 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 祁献民 |
地址: | 100086 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存活性 记录集合 装置及电子设备 训练数据集 计算模型 记录 互联网技术 机器学习 数据清洗 域名信息 正确率 组数据 抽取 存活 丢弃 解析 清洗 计算机 | ||
1.一种域名存活性识别方法,其特征在于,包括:
随机从数据库存储的DNS历史解析记录中抽取满足预设抽取条件且未开泛解析功能的域名的DNS解析记录,生成第一DNS解析记录集合;
为所述第一DNS解析记录集合中的每条DNS解析记录增加域名存活性属性;
测试所述第一DNS解析记录集合中的每条DNS解析记录的域名是否存活,并以测试结果作为对应DNS解析记录中的域名存活性属性值;
根据预定数据清洗策略对所述第一DNS解析记录集合进行数据清洗;
从清洗后的数据中提取4个指定参数对应的4组数据,得到训练数据集;
通过指定机器学习模块对所述训练数据集进行训练,得到域名存活性计算模型并存储;
根据所述域名存活性计算模型判断待识别域名的存活性。
2.根据权利要求1所述的域名存活性识别方法,其特征在于,每条DNS解析记录至少包括:域名、域名的最后解析时间、资源记录;
所述预设抽取条件包括:域名的最后解析时间与当前时间间隔大于预定时长,且资源记录为地址A记录或规范名字CNAME记录,同时域名不能与已经抽取的域名相同。
3.根据权利要求2所述的域名存活性识别方法,其特征在于,所述根据预定数据清洗策略对所述DNS解析记录集合进行数据清洗,包括:
提取所述第一DNS解析记录集合中每个域名的最新一条DNS解析记录,得到第二DNS解析记录集合;
删除所述第二DNS解析记录集合中主域名的DNS解析记录;
计算所述第二DNS解析记录集合中每条DNS解析记录中域名的最后解析时间与当前时间的间隔天数,记为该条DNS解析记录对应域名的第一参数值;
计算所述第二DNS解析记录集合中每条DNS解析记录中的域名去掉主域名字符后的剩余字符长度,记为该条DNS解析记录对应域名的第二参数值;
根据所述第二DNS解析记录集合中每条DNS解析记录中的资源记录,当资源记录为A记录时,记录该条DNS解析记录对应域名的第三参数值为1,当资源记录为CNAM记录时,记录该条DNS解析记录对应域名的第三参数值为0;
将所述第二DNS解析记录集合中的每条DNS解析记录中的域名存活性属性记为第四参数。
4.根据权利要求3所述的域名存活性识别方法,其特征在于,所述从清洗后的数据中提取4个指定参数对应的4组数据,得到训练数据集,包括:
从清洗后的第二DNS解析记录集合中提取所述第一参数对应的第一组数据、第二参数对应的第二组数据、第三参数对应的第三组数据、第四参数对应的第四组数据;所述第i组数据包含所述第二DNS解析记录集合中的n条DNS解析记录的第i参数值,其中,i=一、二、三,n为所述第二DNS解析记录集合包含的DNS解析记录的条数;
从所述第一组数据至第四组数据中分别提取所述第二DNS解析记录集合中的m条DNS解析记录对应的数据,得到训练数据集;所述m/n的值等于预定比例,1≤m≤n。
5.根据权利要求4所述的域名存活性识别方法,其特征在于,所述预定比例为70%;
所述从所述第一组数据至第四组数据中分别提取所述第二DNS解析记录集合中的m条DNS解析记录对应的数据,得到训练数据集,还包括:将提取训练数据集后所述第一组数据至第四组数据剩余的数据作为测试数据集;
其中,所述通过指定机器学习模块对所述训练数据集进行训练,得到域名存活性计算模型并存储,包括:
通过指定机器学习模块对所述训练数据集进行训练,得到域名存活性计算模型;
将所述测试数据集代入所述域名存活性计算模型计算,测试所述域名存活性计算模型的拟合度是否达到预定拟合度阈值;
若所述域名存活性计算模型的拟合度达到预定拟合度阈值,则存储所述域名存活性计算模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京谷安天下科技有限公司,未经北京谷安天下科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810900235.4/1.html,转载请声明来源钻瓜专利网。