[发明专利]一种基于多周期模型stacking的入侵检测系统有效

专利信息
申请号: 202010372115.9 申请日: 2020-05-06
公开(公告)号: CN111683048B 公开(公告)日: 2021-05-07
发明(设计)人: 徐金铭;池灏;金韬 申请(专利权)人: 浙江大学
主分类号: H04L29/06 分类号: H04L29/06;G06K9/62;G06N20/00
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 万尾甜;韩介梅
地址: 310058 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 周期 模型 stacking 入侵 检测 系统
【权利要求书】:

1.一种基于多周期模型stacking的入侵检测系统,其特征在于,该系统包括如下:

对原始流量数据进行特征提取,首先需要利用抓包工具抓取网络上原始流量的pcap格式数据包,然后再利用切包工具可以将其切分为许多会话,以此为基础收集待检测数据,最终针对每个会话生成一个特征向量用于检测;

选择基学习器和元学习器,首先设定总共要集成的基学习器个数N,其中历史模型个数为N-1,为了防止过拟合还需要设定stacking的交叉验证分割训练数据集的个数cv,当入侵检测系统从当前周期进入到下一个周期时,进行改进的stacking集成对系统更新,具体如下:

步骤1.首先检查当前系统的所有的基分类器个数T;如果T=0,此时为系统初开始部署时所处的周期,只需要用当前所有的训练数据训练基学习器,然后进行部署即可,随着当前周期的不断进行,新的训练数据也不断地累积;当前周期结束时,则删除一部分较旧的数据,进入下一个周期,回到步骤1;如果T>0,在这种情况下,如果T=N,则进入步骤3,否则进入步骤2;

步骤2.此时0<T<N,使用改进后的stacking集成算法:假设当前所拥有的数据集D为n×m的矩阵,其中n为数据集的样本数,m为抽取的特征向量的特证数:则:

1)将当前所拥有的数据集D划分成cv个,记为

2)对于每一个分割后的数据集,如第i个数据集Di,用剩余的数据即D-Di训练基学习器,然后用该模型进行预测,得到未参与训练的Di的预测结果Fi,该结果或者是预测概率或者是预测类别;

3)然后将上述结果与数据Di按照特征进行合并拼接得到新的数据矩阵整个数据集也就变换为

4)对于历史周期的模型做类似地处理,由于历史模型是已经训练好的,它们保留了历史数据的信息,因此不需要对数据集做交叉验证分割然后合并,只需直接对数据集D进行预测得到相应的预测结果,然后合并最终得到变换后的新数据集

5)使用得到的新数据集训练元学习器,然后使用数据集D训练基学习器得到当前周期的基分类器,该基分类器将在下一周期中充作历史模型使用;

6)将所有的模型按照stacking集成框架结构组合起来,得到stacking后的模型;

等到该周期结束回到步骤1;

步骤3.此时已有基分类器个数T=N,整体的更新步骤与步骤2类似,唯一的不同在于第4)步需要丢弃一个历史模型,以保证总的基分类器的个数为N;等到该周期结束回到步骤1。

2.根据权利要求1所述的基于多周期模型stacking的入侵检测系统,其特征在于,所述的基学习器采用lightGBM模型。

3.根据权利要求1所述的基于多周期模型stacking的入侵检测系统,其特征在于,所述的元学习器采用Logistic Regression模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010372115.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top