[发明专利]DGA域名检测模型构建方法、装置、服务器及存储介质在审
申请号: | 201811401081.0 | 申请日: | 2018-11-22 |
公开(公告)号: | CN109688110A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 张振海;胡泽柱 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/12;H04L12/24 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 郭栋梁 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练数据集 训练数据 测试样本 模型构建 域名检测 子模型 子集 标签集合 存储介质 检测 服务器 分类算法 决策策略 预测 申请 合法 标签 分组 融合 学习 | ||
1.一种域名生成算法DGA域名检测模型构建方法,其特征在于,包括:
获取训练数据集,所述训练数据集中包括DGA域名及合法域名;
将所述训练数据集分成多个训练数据子集,每个所述训练数据子集包括至少一个所述DGA域名及至少一个所述合法域名;
利用分类算法对每个所述训练数据子集进行训练,得到多个检测子模型;
将测试样本依次输入每个所述检测子模型中,得到所述测试样本的预测标签集合;
根据决策策略对所述预测标签集合进行融合,得到所述测试样本的最终标签。
2.根据权利要求1所述的DGA域名检测模型构建方法,其特征在于,所述训练数据子集中所述DGA域名的数量与所述合法域名的数量相等。
3.根据权利要求1所述的DGA域名检测模型构建方法,其特征在于,所述根据决策策略对所述预测标签集合进行融合,得到所述测试样本的最终标签包括:
统计所述预测标签集合中预测标签为DGA域名的个数;
计算所述个数占所述预测标签集合中预测标签总数的比值;
将所述比值与预设的阈值进行比较,如果大于所述阈值,则表示所述测试样本的最终标签为DGA域名;否则,为合法域名。
4.根据权利要求1-3任一项所述的DGA域名检测模型构建方法,其特征在于,所述预测标签集合包括用于
表示所述测试样本的标签为DGA域名和/或,用于表示所述测试样本的标签为合法域名的标签。
5.一种DGA域名检测模型构建装置,其特征在于,包括:
获取模块,用于获取训练数据集,所述训练数据集中包括DGA域名及合法域名;
分组模块,用于将所述训练数据集分成多个训练数据子集,每个所述训练数据子集包括至少一个所述DGA域名及至少一个所述合法域名;
训练模块,用于利用分类算法对每个所述训练数据子集进行训练,得到多个检测子模型;
测试模块,用于将测试样本依次输入每个所述检测子模型中,得到所述测试样本的预测标签集合;
融合模块,用于根据决策策略对所述预测标签集合进行融合,得到所述测试样本的最终标签。
6.根据权利要求5所述的DGA域名检测模型构建装置,其特征在于,所述分组模块,具体用于将所述训练数据集分成多个训练数据子集,使得每个所述训练数据子集包括数量相等的至少一个所述DGA域名及至少一个所述合法域名。
7.根据权利要求5所述的DGA域名检测模型构建装置,其特征在于,所述融合模块具体用于:
统计所述预测结果集合中预测标签为DGA域名的个数;
计算所述个数占所述预测标签集合中预测标签总数的比值;
将所述比值与预设的阈值进行比较,如果大于所述阈值,则表示所述测试样本的最终标签为DGA域名;否则,为合法域名。
8.根据权利要求5-7任一项所述的DGA域名检测模型构建装置,其特征在于,所述预测标签集合包括用于表示所述测试样本的标签为DGA域名和/或,用于表示所述测试样本的标签为合法域名的标签。
9.一种服务器,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4中任一项所述的DGA域名检测模型构建方法。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,所述计算机程序用于实现如权利要求1-4中任一项所述的DGA域名检测模型构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811401081.0/1.html,转载请声明来源钻瓜专利网。