[发明专利]一种基于深度学习的恶意软件图像格式检测方法及其装置有效
申请号: | 201910886585.4 | 申请日: | 2019-09-19 |
公开(公告)号: | CN110765458B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 陈晋音;邹健飞;袁俊坤 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 恶意 软件 图像格式 检测 方法 及其 装置 | ||
1.一种基于深度学习的恶意软件图像格式检测方法,包括以下步骤:
1)构建恶意软件样本数据集;具体包括:
1.1)收集各个恶意软件家族样本数据集,数据以“.asm”后缀的汇编语言文件类型保存;
1.2)考虑各个类别的样本数量差异以及为便于后续的工作,将各个类别数据集以训练集占比80%、测试集占比20%的比例划分;
2)转换为恶意软件图像格式,具体包括:
2.1)对于步骤1.1)中的“.asm”后缀的汇编语言文件,文件的每个字符都可以在ASCII编码中找到,首先将其通过ASCII标准表映射为十六进制的数字;
2.2)再通过进制转换转化为十进制的数字,恶意软件的长字符串就转化为十进制的长数组;
2.3)将十进制长数组以一定的方式进行拼接,转换为64×64大小的恶意软件灰度图像;
2.4)最后获取图像格式的恶意软件样本;
3)构建卷积神经网络分类器;卷积神经网络作为经典的深度学习网络,被广泛地应用在计算机视觉和图像分类任务中;对输入大小为64×64×1的初始灰度图像,长、宽都为64个像素,灰度图的通道数为1,构建卷积神经网络分类器,具体包括:
3.1)将步骤2.4)获取的图像格式的恶意软件样本依次经过4层卷积层,分别为卷积层1、卷积层2、卷积层3和卷积层4,在初始的4层卷积层中使用长度为2的步幅,快速降低图像在网络训练过程中各层输出的特征图的大小,在各卷积层中,都使用ReLU激活函数;
为尽可能多地挖掘图像信息,每层卷积都使用添零补位的操作,使卷积核可遍历输入图的每一个像素点,同时卷积核的大小随网络深度的增加逐渐降低;初始卷积核数为128,随着网络深度的增加而增加,挖掘更多的高维特征信息;
3.2)在经过4层卷积层后送入1层全连接层,整合前面各层卷积的视野特征,输出N个类别的分类值;
3.3)最后将步骤3.2)获取的N个类别的分类值通过1层Softmax网络层转化为分类概率,概率最大的类别就是当前样本的分类结果;
4)根据样本数据集对分类器进行训练,过程如下:
4.1)获取损失函数;选取的损失函数基于预测分类和样本标签的交叉熵,其格式采用one-hot编码表示,如[0,0,1,0,0,0]表示的样本的标签为6个类别中的第3个;交叉熵表达式如下:
其中yi是样本i的标签,y′i是样本i的预测值,Hi是样本i的交叉熵;首先将样本的预测分类和样本标签的log函数相乘取反,one-hot各维度的熵值累加得到交叉熵;
通过计算所有样本交叉熵的平均值达到当前训练数据的损失函数,表达式如下:
4.2)将步骤2)获取的图像格式的样本输入步骤3)构建好的卷积神经网络分类器进行训练,训练时采用小批量梯度下降的训练方法,每次从训练集中随机选择一批数据用于模型的训练,既可避免随机梯度下降产生的训练震荡,也可避免批量梯度下降对资源的过度消耗,批的大小选择128;考虑到网络更新的稳定性,学习率定为0.001,使用超参数自适应调整的Adam优化器进行训练,训练目标是通过梯度的前向和反向传播调整网络的结构参数,不断降低模型的损失函数值;
4.3)为避免实验偶然性的干扰,实验采用十折交叉验证,即将训练集分成10份,每次选取其中的9份用于训练,一份用于测试,最终对所有结果取平均作为最终的实验结果,恶意软件图像的分类器达到87.17%的分类精度。
2.如权利要求1所述的基于深度学习的恶意软件图像格式检测方法,其特征在于:所述步骤1)中,获取了9个恶意软件家族样本数据集,共10868个恶意软件样本,将恶意软件原始“.asm”后缀的汇编语言文件通过ASCII映射、进制转换、拼接转换为64×64大小的恶意软件灰度图像。
3.如权利要求1所述的基于深度学习的恶意软件图像格式检测方法,其特征在于:在所述步骤3.3)中,除去输入层网络共6层,训练参数共6,780,161个,除去偏置值和全连接层,且实际训练时由于前向、反向计算和优化器的使用,使用的参数量将有所增加;通过网络的层次传递,输入的64×64×1大小的灰度图像数值矩阵,最后输出该样本被分类到N个类别的概率大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910886585.4/1.html,转载请声明来源钻瓜专利网。