[发明专利]一种基于集成学习的半监督分类的入侵检测方法在审
申请号: | 202010925526.6 | 申请日: | 2020-09-04 |
公开(公告)号: | CN112115467A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 肖洪光;陈浩 | 申请(专利权)人: | 长沙理工大学 |
主分类号: | G06F21/55 | 分类号: | G06F21/55;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410114 湖南省长沙市*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 学习 监督 分类 入侵 检测 方法 | ||
1.一种基于集成学习的半监督分类的入侵检测方法,其特征在于,包括以下步骤:
S1、使用生成对抗网络(GAN)生成更多的U2R数据集以提高该类攻击类型的检测率
S2、使用生成的数据集与10%的KDD-NSL数据集组合产生数据集合Dl
S3、使用数据集Dl训练TSVM神经网络作为初始预测模型
S4、使用训练好的TSVM对无标签数据进行预测得到伪标签数据集D′u
S5、使用半监督学习算法得到一组有标签和无标签集合数据集
S6、使用集成学习的方法训练有标签和无标签集合数据集,得到最后的模型。
2.根据权利要求1所述的集成学习的半监督分类的入侵检测方法,其特征在于,所述步骤S1中使用生成对抗网络模拟真实的U2R数据的具体方法为:
S1-1、从NSL-KDD数据集中获取训练数据,从训练数据中选取所有的U2R数据作为生成对抗网络的真实数据X。
S1-2、生成模型G通过捕捉真实样本x的概率分布,使用一组随机变量z生成样本G(z)
S1-3、判定模型D判断D(G(z))的大小,D(X)和G(z)交替地最小化和最大化V(D,G)
S1-4、最终求得近似最优解的生成模型minG,minG生成足够的U2R数据。
3.根据权利要求1所述的集成学习的半监督分类的入侵检测方法,其特征在于,所述步骤S3训练TSVM神经网络作为初始预测模型,其具体做法为:
根据公式1作为计算(w,b),ξ:
s.t.yi(wTxi+b)≥1-ξi,i=1,2,…,l,
ξi>>0,i=1,2,…,m,
首先使用有标记样本集训练出一个初始SVM,0接着使用该学习器对未标记样本进行打标,这样所有的样本都有了标记,并基于这些有标记的样本重新训练SVM,之后在寻找易出错样本不断调整。算法伪代码如下:
输入:有标记的样本集Dl={(x1,y1),(x2,y2),……,(xl,yl)};
未标记的样本集Du={xl+1,xl+2,……xl+u};
折中参数Cl,Cu
过程:
S3-1:用Dl训练一个SVMl作为初始SVM;
S3-2:用SVMl对Du中样本进行预测,得到伪标记
S3-3:初始化Cl,>>Cu;
S3-4:while Cu<Cl do
S3-5:基于DlDu求解式1,得到(w,b),ξ;
S3-6:
S3-7:
S3-8:
S3-9:基于DlDu,ClCu重新求解,得到(w,b),ξ;
S3-10:end while
S3-11:Cu=min{2Cu,Cl}
S3-12:end while
输出:未标记样本的预测结果:。
4.根据权利要求1所述的集成学习的半监督分类的入侵检测方法,其特征在于,所述步骤S4使用训练好的TSVM对无标签数据进行预测得到伪标签数据集D′u其具体做法为:
将S3生成伪标签赋值给对应的样本集形成
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙理工大学,未经长沙理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010925526.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种植物型杀菌除臭剂及其制备方法
- 下一篇:一种加气砌块转运系统