[发明专利]一种基于半监督神经网络模型的入侵检测方法有效
申请号: | 201210074813.6 | 申请日: | 2012-03-20 |
公开(公告)号: | CN102647292A | 公开(公告)日: | 2012-08-22 |
发明(设计)人: | 杨雅辉;阳时来;沈晴霓;黄海珍;夏敏 | 申请(专利权)人: | 北京大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L29/06;G06N3/02 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于半监督神经网络模型的入侵检测方法,属于网络信息安全领域。本方法为:1)利用训练集A初始化GHSOM神经网络第0层神经元,并计算QE0;2)从第0层神经元中拓展出一SOM,并将其层次标识Layer置为1;3)初始化第Layer层中拓展出的每一SOM,并对其进行训练,其中对获胜神经元及其邻域内神经元权值进行调整,更新获胜向量集合,计算获胜神经元的主标签、主标签比率和信息熵etyi;4)计算该SOM中每个神经元的qei,子网MQE;如果MQE>QEf*μ1则在该SOM中插入一行或者一列神经元,如果QEi>QE0*μ2或者etyi>etyf*μ3则从该神经元上长出一层新的子网,将其增加到Layer+1层的子网队列中。本方法提高了GHSOM算法检验准确性。 | ||
搜索关键词: | 一种 基于 监督 神经网络 模型 入侵 检测 方法 | ||
【主权项】:
一种基于半监督神经网络模型的入侵检测方法,其步骤为:1)利用输入训练数据集合A初始化GHSOM神经网络第0层神经元的权值,并计算其量化误差QE0;所述集合A中包含部分有标签的训练数据;2)从第0层的神经元中拓展出一个2×2结构SOM,并将其层次标识Layer置为1;3)对于第Layer层中拓展出的每一2×2结构SOM:a)初始化其中4个神经元的权值,同时将神经元i获胜的输入向量集合Ci置为空、主标签置为NULL、主标签比率ri置为0;b)SOM的训练数据T继承于其父神经元的获胜输入向量集合;从训练数据集T中挑选输入向量进行训练,直到达到预定训练次数:如果当前所选输入向量X为不带标签的数据,则计算它与每个神经元的欧几里得距离,选择距离最短的神经元W作为获胜神经元;如果X为带标签的数据,则选择主标签与X标签相同且ri值最大的神经元作为获胜神经元,更新该获胜神经元主标签;如果找不到主标签与X标签相同的神经元,则将与X欧几里得距离最近的神经元i作为X的获胜神经元;对获胜神经元及其邻域内神经元的权值进行调整,更新获胜向量集合Wi=Wi∪X,计算获胜神经元的主标签、主标签比率ri和神经元信息熵etyi;4)计算SOM中每个神经元的量化误差QEi,SOM的平均量化误差MQE;如果MQE>QEf*μ1,则在该SOM中插入一行或者一列神经元,采用步骤b)方法进行训练;如果QEi>QE0*μ2或者etyi>etyf*μ3,则从神经元i上长出一层新的SOM子网,将新长出的SOM增加到第Layer+1层的子网队列中;5)对于新拓展出的Layer+1层的SOM,采用步骤3)、4)方法对其进行训练,直至神经网络不再产生新的神经元和新的分层,得到神经网络检测模型;6)采用得到的神经网络检测模型,对采集的协议流数据进行检测;其中,所述主标签为在神经元获胜的所有有标签的样本数据中包含标签样本最多的标签,所述主标签比率ri=nk/m,nk为神经元的主标签、m为神经元有标签样本总数;QEf为父神经元的量化误差、μ1为层内扩展控制系数、μ2为量化误差层拓展控制系数、μ3为信息熵层拓展控制系数、etyf为父神经元信息熵。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210074813.6/,转载请声明来源钻瓜专利网。