[发明专利]一种网络安全异常检测中深度学习模型的更新方法与装置在审
申请号: | 202211606695.9 | 申请日: | 2022-12-13 |
公开(公告)号: | CN116032557A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 王之梁;韩东岐;金明辉;陈闻起;王凯;蔚睿;王苏;张晗;杨家海;施新刚;尹霞;肖飞;王治华;高峰 | 申请(专利权)人: | 清华大学;国网上海市电力公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L41/14;H04L41/082;G06N20/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 石茵汀 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络安全 异常 检测 深度 学习 模型 更新 方法 装置 | ||
1.一种网络安全异常检测中深度学习模型的更新方法,其特征在于,包括以下步骤:
对不同网络安全场景的样本数据进行特征提取得到高维特征向量;其中,所述不同网络安全场景的样本数据包括不同网络安全数据的当前数据分布的对照集样本和历史数据分布的控制集样本;
将所述高维特征向量输入至异常检测模型得到模型输入样本异常度值的原始输出值,对所述原始输出值进行校正并对校正后的原始输出值进行漂移检测得到基于置信度的漂移检测结果;
基于所述漂移检测结果得到基于所述对照集样本和所述控制集样本的优化目标函数,通过计算所述优化目标函数得到引起网络安全数据分布发生变化的漂移样本;
利用所述漂移样本对所述异常检测模型进行模型重训练,通过计算模型重训练时的损失函数以优化模型参数权重,并基于优化后的模型参数权重以得到训练好的异常检测模型。
2.根据权利要求1所述的方法,其特征在于,所述对原始输出值进行校正并对校正后的原始输出值进行漂移检测得到基于置信度的漂移检测结果,包括:
基于线性分段拟合方法构建映射函数,并计算每个样本在模型中的原始输出值和理想值;其中,所述异常度值包括分别利用对照集样本和控制集样本在模型中校正后的输出概率分布;
利用所述映射函数对多个分段函数进行拟合,迭代所述多个分段函数中断点的位置,根据拟合程度确定断点位置及每段函数的斜率以得到多个分段函数的拟合结果;以及,
基于所述拟合结果对所述对照集样本和控制集样本的概率数据进行映射转换,基于映射转换结果对所述输出概率分布进行对比以根据对比结果得到网络安全数据分布是否发生变化的漂移检测结果。
3.根据权利要求1所述的方法,其特征在于,所述优化目标函数的表达式为:
其中mc和mt是优化函数的自变量,是在0-1之间的mask参数,分别对应每个对照集样本和控制集样本;为第一类优化目标的准确性指标,评估用mc和mt生成的分布和真实的新分布之间的距离,为第二类优化目标的标记开销,评估生成分布过程中需要的对照集样本数量,为第三类优化目标的准确性指标,评估mc和mt的确定性,pc和pt分别表示每个控制集和对照集样本在异常检测模型中的输出值,⊙表示哈达玛积,即对向量中的元素逐项乘积,表示向量拼接操作,表示KL散度,将输入向量转化为直方图中的频率向量,M为分桶数量,表示计算期望,λ1和λ2是超参数,控制三项优化目标之间的权重。
4.根据权利要求1所述的方法,其特征在于,所述模型重训练时的损失函数的表达式为:
其中是模型原始的损失函数,f表示异常检测模型,θ表示异常检测模型参数,为给模型不同参数的权重Ωi,θi和分别表示第i个新的模型参数和旧的模型参数,λ3是超参数,控制两个优化项的比重。
5.根据权利要求4所述的方法,其特征在于,所述权重Ωi的计算方式为:
是第j个控制集样本,通过优化函数计算出的控制集样本mask参数,表示第j个控制集样本输入到模型中得到的模型输出logits,表示对上述logits计算L2-norm后平方,表示上述值对模型参数求偏导数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;国网上海市电力公司,未经清华大学;国网上海市电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211606695.9/1.html,转载请声明来源钻瓜专利网。