[发明专利]检测模型的训练方法、装置、计算机设备和存储介质在审
申请号: | 202211035222.8 | 申请日: | 2022-08-26 |
公开(公告)号: | CN115396212A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 袁俊杰;韩丽娜;韩世龙;张英伟;王波;潘彭丹;吴潇;裴军;崔恩泽 | 申请(专利权)人: | 国科华盾(北京)科技有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L43/02;H04L43/04;G06N20/00 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 樊春燕 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 模型 训练 方法 装置 计算机 设备 存储 介质 | ||
1.一种检测模型的训练方法,其特征在于,所述方法包括:
获取第一网络数据集以及第二网络数据集,并将所述第一网络数据集和所述第二网络数据集进行融合处理,得到样本数据集;所述样本数据集包括样本网络数据和所述样本网络数据的数据类型标识,所述数据类型标识包括正常数据类型标识和攻击数据类型标识;
对各所述样本网络数据进行特征提取,得到网络特征数据集;所述网络特征数据集包含提取出的各样本网络特征数据、以及各所述样本网络特征数据对应的初始权重;
基于权重调整算法对所述各所述样本网络特征数据对应的初始权重进行更新,并基于更新后的权重构建目标网络特征数据集;所述目标网络特征数据集包括目标样本网络特征数据、所述目标样本网络特征数据的数据类型标识以及各所述样本网络特征数据对应的权重;
基于所述目标网络特征数据集和各所述目标样本网络特征数据对应的数据类型标识,对机器学习模型进行训练,得到检测模型,所述检测模型用于检测网络数据的数据类型标识。
2.根据权利要求1所述的方法,其特征在于,所述获取第一网络数据集以及第二网络数据集,并将所述第一网络数据集和所述第二网络数据集进行融合处理,得到样本数据集,包括:
获取网络公开数据集作为所述第一网络数据集,并通过预设数据抓取策略,抓取得到所述第二网络数据集;
将所述第一网络数据集中各网络数据与所述第二网络数据集中各网络数据进行拼接,得到所述样本数据集,所述第一网络数据与所述第二网络数据的数据类型标识满足预设相似度条件。
3.根据权利要求1所述的方法,其特征在于,所述对各所述样本网络数据进行特征提取,得到网络特征数据集,包括:
对所述样本数据集中的所述各所述样本网络数据进行数据预处理,得到数据预处理后的各所述样本网络数据;
使用随机森林算法对所述数据预处理后的各所述样本网络数据进行特征提取,得到所述网络特征数据集。
4.根据权利要求1所述的方法,其特征在于,所述基于权重调整算法对所述各所述样本网络特征数据对应的初始权重进行更新,包括:
获取预先定义的权重字典,所述权重字典包括所述攻击数据类型标识和权重值;
通过所述权重调整算法和所述权重字典,对各所述样本网络特征数据对应的初始权重进行更新。
5.根据权利要求1所述的方法,其特征在于,所述基于所述目标网络特征数据集和各所述目标样本网络特征数据对应的数据类型标识,对机器学习模型进行训练,得到检测模型之后,还包括:
获取测试数据集,所述测试数据集包括各测试网络特征数据和各所述测试网络特征数据的数据类型标识;
将所述测试数据集输入所述检测模型中进行模型测试,得到测试结果;
将所述测试结果与所述测试数据集中的所述攻击数据类型标识对比,判断是否符合预设的相关度条件,如果满足所述预设的相关度条件则保存所述检测模型作为最终的检测模型。
6.一种网络数据的检测方法,其特征在于,所述方法包括:
获取待检测的网络数据;
对所述待检测的网络数据进行特征提取,得到网络特征数据;
将所述网络特征数据输入预先训练的检测模型,得到所述待检测的网络数据对应的数据类型标识;
其中,所述检测模型采用如权利要求1至5任一所述的检测模型的训练方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国科华盾(北京)科技有限公司,未经国科华盾(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211035222.8/1.html,转载请声明来源钻瓜专利网。