[发明专利]基于BiRNN深度学习的DGA域名检测方法在审
申请号: | 201910904014.9 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110807098A | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 袁明 | 申请(专利权)人: | 武汉智美互联科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08;H04L29/06 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 王维新 |
地址: | 430000 湖北省武汉市东湖新技术开发区光谷大道*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 birnn 深度 学习 dga 域名 检测 方法 | ||
1.一种基于BiRNN深度学习的DGA域名检测方法,其特征在于,包括:
对收集的分别标记为正常域名和DGA域名的域名数据进行清洗,保留有效域名数据;
将所述有效域名数据预处理为统一长度的一维向量;
建立基于BiRNN的深度学习分类模型,其中,所述深度学习分类模型将域名的字符转化为词向量,并输入BiRNN神经网络以提取域名的文本特征,利用全连接网络分类器对所述BiRNN神经网络提取的文本特征进行分类;
根据正常域名数据和DGA域名数据对应的所述全连接网络分类器的分类结果训练所述深度学习分类模型;
将现网捕获的新域名进行清洗和预处理后导入所述深度学习分类模型,判断所述新域名是正常域名或DGA域名。
2.根据权利要求1所述的基于BiRNN深度学习的DGA域名检测方法,其特征在于,对域名进行清洗具体包括去除重复、错误的域名,以及删除域名的开头,保留有效域名部分。
3.根据权利要求1所述的基于BiRNN深度学习的DGA域名检测方法,其特征在于,所述将所述有效域名数据预处理为统一长度的一维向量具体包括:
设置字典字符到不同数字字符表的映射关系;
根据所述映射关系确定所述有效域名数据的数字向量;
将所述有效域名数据的数字向量调整为预设统一长度。
4.根据权利要求1所述的基于BiRNN深度学习的DGA域名检测方法,其特征在于,所述将域名的字符转化为词向量并输入BiRNN神经网络以提取域名的文本特征具体包括:
以域名作为字符序列建立字符嵌入向量表;
将数字向量的域名根据所述字符嵌入向量表映射为所述词向量;
所述BiRNN神经网络对输入的词向量的正反两个时序方向的文本特征进行提取,将所述BiRNN神经网络的最终输出或最终状态作为所述域名的文本特征。
5.根据权利要求1所述的基于BiRNN深度学习的DGA域名检测方法,其特征在于,利用收集的大量标记为正常域名和DGA域名的数据对所述深度学习分类模型进行训练,并在所述深度学习分类模型的分类测试结果达到稳定阈值时保存该深度学习分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉智美互联科技有限公司,未经武汉智美互联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910904014.9/1.html,转载请声明来源钻瓜专利网。