[发明专利]一种基于多经验核学习的网络入侵检测方法有效

专利信息
申请号: 201910487553.7 申请日: 2019-06-05
公开(公告)号: CN110324178B 公开(公告)日: 2021-11-30
发明(设计)人: 李冬冬;王喆;李艳琼;马幪浩;杜文莉;张静 申请(专利权)人: 华东理工大学
主分类号: H04L12/24 分类号: H04L12/24;H04L29/06
代理公司: 暂无信息 代理人: 暂无信息
地址: 200237 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 经验 学习 网络 入侵 检测 方法
【权利要求书】:

1.一种基于多经验核学习的网络入侵检测方法,包括以下步骤:

1)预处理:通过网络工具获取网络入侵的数据集,将采集的数据集的特征转为数据矩阵,并对所有离散特征进行one-hot转换;

2)训练第一步:对一个包括正、负类样本的不平衡网络入侵数据的训练样本集进行学习,得到万有引力平衡的样本GBMS及其近邻样本NNB,具体如下:

假设不平衡网络入侵数据的训练样本集为X={xi,yi,(i=1,2,...,N),yi∈{+1,-1}},其中正类样本即网络入侵数据:Xpos={xi|xi∈X,yi=1},负类样本即正常的网络数据:Xneg={xj|xj∈X,yj=-1};在所述方法中,首先找出距离每个负类样本最近的少数类样本,然后计算所有负类样本与距离其最近的正类样本的中点MS:;根据所有训练样本和测试样本计算半径R:,对每个MS来说,距离它R以内的样本称为候选样本,Candi|Candi∈X,d(candi,MSj)<R;MS的万有引力就是所对应候选集内的正负类样本对它的万有引力:

将所有MS对应的万有引力进行排序,选择万有引力较小的前30%的MS样本成为万有引力平衡样本GBMS;假设生成的GBMS样本有g个,表示为GBMS用于拟合分类边界,为了防止得到的分类边界过拟合,对于每一个GBMS样本,在训练样本中找到它的3个最近邻样本NNB用来扰动分类边界的生成;选择的这些近邻训练样本NNB是靠近分类边界的真实样本,可表示为类似地,

3)训练第二步:将训练样本和得到的GBMS和NNB样本进行多经验核映射,得到多个核空间中的训练样本、GBMS和NNB样本;其中经验核映射(Empirical Kernel Mapping,EKM)定义为:Φe:X→F,m个核空间,它们对应的经验核映射可以表示为

4)训练第三步:利用每个核空间映射后的GBMS和NNB样本,分别生成两个正则化项,并代入多经验核学习的目标函数中;其特征在于,所述利用每个核空间映射后的GBMS和NNB样本,分别生成两个正则化项,并代入多经验核学习的目标函数中;

所述万有引力平衡样本GBMS所生成的正则化项RGBMS定义如下:

RGBMS=(YlGwl)T(YlGwl)

其中,YlG表示所述GBMS样本映射在第l个核空间的增广矩阵;假设有m个核空间,它们对应的经验核映射可以表示为;则是权重向量,W为增广向量;所述GBMS样本的近邻样本NNB样本生成的正则化项RNNB定义如下:

RNNB=(YlBwl)T(YlBwl)

其中,wl为第l个核空间的增广权向量wl0为fl的偏移量,YlB表示所述NNB样本映射在第l个核空间的增广矩阵,即;

原始MultiK多经验核学习的目标函数为:

,其中对应于由映射样本集所决定的特征空间中的学习参数,λ是控制因子,用以协调前项和后项之间的平衡;

将所述两个正则化项代入多经验核学习的框架中得到目标函数如下:

其中,fl表示第l个核空间的基分类器,αl和βl是控制参数,分别控制正则化项RGBMS和RNNB在GBMKL模型中的权重,wl为第l个核空间的增广权向量Dir为每个核空间的权重,N是样本数,c1是正则项系数,λ表示多核空间损失的参数,用于调节权重;

5)训练第四步:对所述目标函数进行求解,得到并记录最终的判定函数;具体如下:

为了求出最优的权值向量wl,采用启发式梯度下降法对所述目标函数进行优化;所述目标函数分别对wl和b求导可以得到:

其中,是一个对角矩阵,最后一维的对角元素及非对角的元素均为0,其他对角元素均为1,可以得到bl=Ylwl-1N×1;bl表示样本在第l个核空间中与fl的边界向量,且bl的值是非负的;本模型通过误差向量el来更新bl

其中,p为迭代次数,ρ为学习率,且ρ>0,误差向量el=Ylwl-1N×1-bl,表示第l个视角下第p轮迭代,L是损失函数,Yl表示所述NNB样本映射在第l个核空间的增广矩阵,1N×1表示N×1维的各个分量均为1的列向量,cl:表示正则化项的系数,αl和βl是控制参数,分别控制正则化项RGBMS和RNNB在GBMKL模型中的权重,λ表示多核空间损失的参数,用于调节权重;我们定义了参数ξ为终止条件,当||Lp+1-Lp||2≤ξ时,停止迭代;

6)测试第一步:对于待检测的样本,利用与训练过程同样的多经验核函数进行核映射;

7)测试第二步:利用所述的判定函数对映射后的待检测样本进行预测,并将多个核空间的结果进行投票,将待检测样本判定为得到投票数最多的类别;其特征在于,所述利用所述的判定函数对映射后的待检测样本进行预测,并将多个核空间的结果进行投票,将待检测样本判定为得到投票数最多的类别;最终的判别函数为:

如果L(x)0那么该样本为少数类样本,即包含网络入侵的数据,否则为多数类样本,即正常的网络数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学,未经华东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910487553.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top