[发明专利]一种基于对抗掩码的网络流量异常检测系统与方法在审
申请号: | 202211391596.3 | 申请日: | 2022-11-08 |
公开(公告)号: | CN115589329A | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 张一航;黄晓霖;杨根科;褚健 | 申请(专利权)人: | 上海交通大学宁波人工智能研究院 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L43/04 |
代理公司: | 上海剑秋知识产权代理有限公司 31382 | 代理人: | 徐海兵 |
地址: | 315012 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 掩码 网络流量 异常 检测 系统 方法 | ||
本发明公开了一种基于对抗掩码的网络流量异常检测系统与方法,涉及网络流量异常检测领域,所述系统包括上游的前置模型和下游的分类检测模型;前置模型包括对抗掩码生成模块、编码器网络、特征向量评估模块和掩码向量评估模块;分类检测模型包括训练过的编码器网络,以及分类器。所述方法包括:步骤1、对原始数据集进行数据预处理;步骤2、构建对抗掩码生成模块;步骤3、应用预先设计的对抗攻击算法,对训练数据集中的每一个原始样本生成一个相应的对抗样本;步骤4、完成编码器网络以及特征向量评估模块和掩码向量评估模块的训练;步骤5、将分类器连接在编码器网络后面,且仅对分类器进行训练,得到最终的分类模型。
技术领域
本发明涉及网络流量异常检测领域,尤其涉及一种基于对抗掩码的网络流量异常检测系统与方法。
背景技术
随着机器学习的深入发展,基于机器学习的网络异常检测模型已经成为主流方案。它通过从流量中提取特征,用检测器进行分类,极大提高了网络异常检测系统的检测性能,克服了传统网络流量异常检测系统识别检测不稳定,处理效率不高、自适应能力差等缺点。最近有研究已经发现机器学习模型具有脆弱性,容易被精心设计的样本所欺骗。因此为了有效应对对抗样本的威胁,已经有不少工作研究如何提升网络异常检测模型的鲁棒性。
但是,目前有关利用对抗样本提升网络异常检测模型精度的研究依然比较稀缺。由于在该领域,很难收集到大量有标签的数据样本,所以有研究工作选择使用随机掩码模型作为前置任务去更好地学习样本特征。虽然随机掩码模型充当着数据增强功能,但是生成的假样本处于哪一类真实样本的数据流形之上却是未知的,而这可能会导致前置模型的无效学习。尽管最近在图像识别领域有研究者开始利用对抗目标去提升图像编码器的表征学习能力,关于网络流量异常检测领域的对抗样本特性的使用还尚未研究,并且网络流量特征与图像特征不同,它并非每个特征都是连续的,因此设计一种属于网络安全领域独特的对抗样本生成算法也尤为关键。
陈振宇等人在中国发明专利申请“一种基于数据防御的深度学习模型优化方法”(申请号:CN202010712774.2)中为了针对对抗样本攻击方法优化模型,数据层面的防御策略主要通过在训练阶段将对抗样本注入训练数据集后重新训练模型,或预测阶段对样本进行修改,进行重建并将转换后的对抗样本输入到原模型来进行预测。利用开源对抗样本生成工具对待测模型以及目标数据集生成对抗样本,比较生成对抗样本前后模型在指定数据集上的成功率,但该发明属于在图像识别领域借助对抗样本对训练模型或预测阶段进行优化。
因此,本领域的技术人员致力于开发一种新的网络流量异常检测方法,提供一种属于网络安全领域独特的对抗样本生成算法,克服上述随机掩码模型可能会生成无效数据的问题。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何克服随机掩码模型可能会生成无效数据的问题,通过设计针对网络流量特征的对抗攻击算法,并将该对抗攻击引入到掩码生成模型之中,进而生成对模型更具有挑战性的假样本,从而帮助前置模型学习到更为丰富的潜在信息,从而提升模型训练的效率与检测精度。
为实现上述目的,本发明提供了一种基于对抗掩码的网络流量异常检测系统,所述系统包括上游的前置模型和下游的分类检测模型;
其中,所述前置模型包括对抗掩码生成模块、编码器网络、特征向量评估模块和掩码向量评估模块;在上游的所述前置模型中,将对所述编码器网络进行训练;
所述分类检测模型包括训练过的所述编码器网络,以及分类器;在保证所述编码器网络的权重不变的情况下仅对所述分类器进行训练,得到最终的分类模型;所述分类模型对测试数据集进行分类预测。
进一步地,所述对抗掩码生成模块接收由原始样本组成的原始数据集,生成远离输入的所述原始样本的流形的对抗样本;
所述编码器网络接收所述对抗掩码生成模块生成的所述对抗样本,借助于深层神经网络的非线性特征提取能力,从人为设置的代理任务中提取所述对抗样本中的隐含特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学宁波人工智能研究院,未经上海交通大学宁波人工智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211391596.3/2.html,转载请声明来源钻瓜专利网。