[发明专利]一种基于对抗掩码的网络流量异常检测系统与方法在审
申请号: | 202211391596.3 | 申请日: | 2022-11-08 |
公开(公告)号: | CN115589329A | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 张一航;黄晓霖;杨根科;褚健 | 申请(专利权)人: | 上海交通大学宁波人工智能研究院 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L43/04 |
代理公司: | 上海剑秋知识产权代理有限公司 31382 | 代理人: | 徐海兵 |
地址: | 315012 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 掩码 网络流量 异常 检测 系统 方法 | ||
1.一种基于对抗掩码的网络流量异常检测系统,其特征在于,所述系统包括上游的前置模型和下游的分类检测模型;
其中,所述前置模型包括对抗掩码生成模块、编码器网络、特征向量评估模块和掩码向量评估模块;在上游的所述前置模型中,将对所述编码器网络进行训练;
所述分类检测模型包括训练过的所述编码器网络,以及分类器;在保证所述编码器网络的权重不变的情况下仅对所述分类器进行训练,得到最终的分类模型;所述分类模型对测试数据集进行分类预测。
2.如权利要求1所述的基于对抗掩码的网络流量异常检测系统,其特征在于,所述对抗掩码生成模块接收由原始样本组成的原始数据集,生成远离输入的所述原始样本的流形的对抗样本;
所述编码器网络接收所述对抗掩码生成模块生成的所述对抗样本,借助于深层神经网络的非线性特征提取能力,从人为设置的代理任务中提取所述对抗样本中的隐含特征;
所述特征向量评估模块连接所述编码器网络,将所述隐含特征还原成与所述原始样本一样维度的特征形式,并利用重构误差来衡量所述对抗样本与所述原始样本之间的距离;
所述掩码向量评估模块同样连接所述编码器网络,预测所述潜在特征的位置。
3.如权利要求2所述的基于对抗掩码的网络流量异常检测系统,其特征在于,所述对抗掩码生成模块包括一个自动编码器,所述自动编码器又包括一个编码器和一个解码器,将输入的所述原始样本通过所述编码器得到潜在特征,再利用所述解码器将所述潜在特征还原为和所述原始样本的维度一样的重构样本,所述重构样本即所述对抗样本。
4.如权利要求1所述的基于对抗掩码的网络流量异常检测系统,其特征在于,所述特征向量评估模块和所述掩码向量评估模块是并行搭建。
5.一种基于对抗掩码的网络流量异常检测方法,其特征在于,所述方法包括以下步骤:
步骤1、对原始数据集进行数据预处理;所述原始数据集为包括连续特征和离散特征的网络数据,由原始样本组成;对于所述连续特征,利用min-max方式转换到0到1的区间之中;对于所述离散特征,使用独热编码转换为数值形式;取所述原始数据集的10%数据作为训练数据集,剩余90%数据作为测试数据集;将经过预处理后的所述原始数据集记为其中其中,表示维度大小为d的实数集;
步骤2、构建对抗掩码生成模块,所述对抗掩码生成模块包括一个自动编码器;将所述训练数据集中的所述原始样本取出,作为所述自动编码器的训练集,并利用重构误差作为所述自动编码器的损失函数;
将所述自动编码器记为I,所述训练数据集记为x,则相应的所述损失函数为:
其中,I相当于一个函数表达式,I(x)表示当函数表达式的输入为x时的输出结果;在中,右侧底下的2表示求向量x-I(x)的第二范数的值,上面的2表示对第二范数求平方值;
在所述自动编码器的训练完毕后,将所述损失函数作为判断样本是否异常的衡量标准;如果所述原始样本的重构误差高于预先设定的阈值,则判定为异常样本,否则为正常样本;
步骤3、应用预先设计的对抗攻击算法,对所述训练数据集中的每一个所述原始样本生成一个相应的对抗样本;
步骤4、完成编码器网络以及特征向量评估模块和掩码向量评估模块的训练和构建;
步骤5、将分类器连接在已经训练好的所述编码器网络后面,在保证所述编码器网络的权重不变的情况下仅对所述分类器进行训练,得到最终的分类模型;所述分类模型对所述测试数据集进行分类预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学宁波人工智能研究院,未经上海交通大学宁波人工智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211391596.3/1.html,转载请声明来源钻瓜专利网。