[发明专利]一种基于参数优化元学习的恶意软件家族分类方法在审
申请号: | 202110259214.0 | 申请日: | 2021-03-10 |
公开(公告)号: | CN112884061A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 王方伟;柴国芳;王长广;李青茹;赵冬梅;曾水光 | 申请(专利权)人: | 河北师范大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;H04L29/06 |
代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 董金国 |
地址: | 050024 河*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 参数 优化 学习 恶意 软件 家族 分类 方法 | ||
1.一种基于参数优化元学习的恶意软件家族分类方法,其特征在于:包括如下步骤:
步骤1:恶意软件文件预处理:将样本恶意软件文件逐一转换为灰度图像样本;所述灰度图像样本随机划分为训练集Dtrain,验证集Dval,测试集Dtest;
步骤2:神经网络模型训练:
步骤2-1:抽取训练数据:从训练集Dtrain随机抽取样本构成1个以上任务,每个任务包括支撑集Dsupport和搜索集Dquery;
步骤2-2:使用支撑集Dsupport中的灰度图像样本来计算模型参数,进行第一次梯度更新;损失函数使用交叉熵损失函数,计算方法为:
其中,x(j)和y(j)是第j个灰度图像样本和标签,是初始化参数为的神经网络模型;是交叉熵损失函数,θ′i是第i个任务支撑集样本计算的第一次更新参数,α为学习率,是损失函数对初始化参数的梯度;
步骤2-3:以第一次更新参数θ′i为初始参数,使用搜索集Dquery中的灰度图像样本学习模型参数,使损失函数之和最小;
步骤2-4:以第一次更新参数θ′i为模型参数,以任务中灰度图像样本的损失函数总和为目标函数,优化模型参数,模型参数更新方法为:
其中,β为学习率,Ti为第i个任务,为搜索集Dquery上的任务对初始参数梯度,为更新后的参数;
步骤2-5:计算任务中灰度图像样本在当前模型参数条件下各恶意软件家族的训练精度,并根据训练精度进行恶意软件家族排序,对于准确率低于预设阈值的恶意软件家族将所使用的灰度图像样本作为困难样本加入下一轮训练的任务中;
步骤2-6:判断本次与上次训练的模型参数对各恶意软件家族分类的训练精度之差是否小于收敛阈值或是否为最后一个任务,如果是,结束转向步骤3,否则转向步骤2-2;
步骤3:模型测试:在测试集Dtest中随机选择1批以上任务进行模型测试,计算各恶意软件家族分类的准确率、精确率、召回率、F1-score指标;
步骤4:模型微调:随机在训练集中抽取1个以上任务,用任务中支撑集Dsupport中的灰度图像样本对步骤3训练好的模型进行微调,微调方法与步骤2相同,用Dquery集去测试模型输出准确率。
2.根据权利要求1所述的基于参数优化元学习的恶意软件家族分类方法,其特征在于:所述神经网络模型包含四个结构相同的神经块,各神经块包括一个卷积层,一个BatchNorm层和一个ReLu非线性层;各神经块的输出经2×2的最大池化层后进入分类层Linear,输出分类概率。
3.根据权利要求1所述的基于参数优化元学习的恶意软件家族分类方法,其特征在于:第一个卷积块中卷积核的大小为3×3×6,输出的特征图的大小为40×40×6;第二个卷积块中卷积核的大小为3×3×16,输出的特征图的大小为20×20×16;第三个卷积块中卷积核的大小为3×3×32,输出特征图的大小为10×10×32;第四个卷积块中卷积核的大小为3×3×32,输出特征图的大小为5×5×32。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北师范大学,未经河北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110259214.0/1.html,转载请声明来源钻瓜专利网。