[发明专利]DGA域名检测模型构建方法、装置、服务器及存储介质在审
申请号: | 201811401081.0 | 申请日: | 2018-11-22 |
公开(公告)号: | CN109688110A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 张振海;胡泽柱 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/12;H04L12/24 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 郭栋梁 |
地址: | 518061 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练数据集 训练数据 测试样本 模型构建 域名检测 子模型 子集 标签集合 存储介质 检测 服务器 分类算法 决策策略 预测 申请 合法 标签 分组 融合 学习 | ||
本申请公开了一种DGA域名检测模型构建方法、装置、服务器及存储介质,该方法包括获取训练数据集,该训练数据集中包括DGA域名及合法域名;将该训练数据集分成多个训练数据子集,每个该训练数据子集包括至少一个该DGA域名及至少一个该合法域名;利用分类算法对每个该训练数据子集进行训练,得到多个检测子模型;将测试样本依次输入每个该检测子模型中,得到该测试样本的预测标签集合;根据决策策略对该预测标签集合进行融合,得到该测试样本的最终标签。本申请实施例提供的DGA域名检测模型构建方法,通过对训练数据集的分组,得到多个检测子模型,实现了对训练数据集的完整学习,体现了实际DGA域名的特性。
技术领域
本申请一般涉及计算机技术领域,具体涉及一种DGA域名检测模型构建方法、装置、服务器及存储介质。
背景技术
域名生成算法(Domain generation algorihms,DGA)域名是一种通过算法自动生成的随机域名。恶意软件或潜伏的攻击程序常常通过DGA域名与外界的控制服务器建立网络连接,根据攻击者下发的指令,执行数据盗取等网络攻击。因此,DGA域名检测对于发现潜伏的攻击具有重要的意义。
目前,在DGA域名检测中,通常采用机器学习算法对获取的域名的结构特征进行训练,得到一个DGA检测模型,进而通过训练得到DGA检测模型对DGA域名进行检测。
在采用机器学习算法对域名的结构特征进行训练的过程中,得到的单个DGA域名检测模型无法完全学习到DGA域名的所有特征,导致得到的DGA域名检测模型无法充分体现实际DGA域名的特性,使得DGA域名检测模型的准确性低。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种DGA域名检测模型构建方法、装置、服务器及存储介质,以解决单个DGA域名检测模型无法充分体现实际DGA域名的特性的问题。
第一方面,本申请实施例提供一种DGA域名检测模型构建方法,该方法包括:
获取训练数据集,该训练数据集中包括DGA域名及合法域名;
将该训练数据集分成多个训练数据子集,每个该训练数据子集包括至少一个该DGA域名及至少一个该合法域名;
利用分类算法对每个该训练数据子集进行训练,得到多个检测子模型;
将测试样本依次输入每个该检测子模型中,得到该测试样本的预测标签集合;
根据决策策略对该预测结果标签进行融合,得到该测试样本的最终标签。
第二方面,本申请实施例提供的一种DGA域名检测模型构建装置,该装置包括:
获取模块,用于获取训练数据集,该训练数据集中包括DGA域名及合法域名;
分组模块,用于将该训练数据集分成多个训练数据子集,每个该训练数据子集包括至少一个该DGA域名及至少一个该合法域名;
训练模块,用于利用分类算法对每个该训练数据子集进行训练,得到多个检测子模型;
测试模块,用于将测试样本依次输入每个该检测子模型中,得到该测试样本的预测标签集合;
融合模块,用于根据决策策略对该预测标签集合进行融合,得到该测试样本的最终标签。
第三方面,本申请提供一种服务器,该服务器包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如第一方面所述的DGA域名检测模型构建方法。
第四方面,本申请提供一种计算机存储介质,该计算机程序用于实现如第一方面所述的DGA域名检测模型构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811401081.0/2.html,转载请声明来源钻瓜专利网。