[发明专利]一种基于深度学习的恶意软件图像格式检测方法及其装置有效

申请号：	201910886585.4	申请日：	2019-09-19
公开（公告）号：	CN110765458B	公开（公告）日：	2021-06-08
发明（设计）人：	陈晋音;邹健飞;袁俊坤	申请（专利权）人：	浙江工业大学
主分类号：	G06F21/56	分类号：	G06F21/56;G06K9/62
代理公司：	杭州天正专利事务所有限公司 33201	代理人：	王兵;黄美娟
地址：	310014 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习恶意软件图像格式检测方法及其装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的恶意软件图像格式检测方法，包括以下步骤：

1)构建恶意软件样本数据集；具体包括：

1.1)收集各个恶意软件家族样本数据集，数据以“.asm”后缀的汇编语言文件类型保存；

1.2)考虑各个类别的样本数量差异以及为便于后续的工作，将各个类别数据集以训练集占比80％、测试集占比20％的比例划分；

2)转换为恶意软件图像格式，具体包括：

2.1)对于步骤1.1)中的“.asm”后缀的汇编语言文件，文件的每个字符都可以在ASCII编码中找到，首先将其通过ASCII标准表映射为十六进制的数字；

2.2)再通过进制转换转化为十进制的数字，恶意软件的长字符串就转化为十进制的长数组；

2.3)将十进制长数组以一定的方式进行拼接，转换为64×64大小的恶意软件灰度图像；

2.4)最后获取图像格式的恶意软件样本；

3)构建卷积神经网络分类器；卷积神经网络作为经典的深度学习网络，被广泛地应用在计算机视觉和图像分类任务中；对输入大小为64×64×1的初始灰度图像，长、宽都为64个像素，灰度图的通道数为1，构建卷积神经网络分类器，具体包括：

3.1)将步骤2.4)获取的图像格式的恶意软件样本依次经过4层卷积层，分别为卷积层1、卷积层2、卷积层3和卷积层4，在初始的4层卷积层中使用长度为2的步幅，快速降低图像在网络训练过程中各层输出的特征图的大小，在各卷积层中，都使用ReLU激活函数；

为尽可能多地挖掘图像信息，每层卷积都使用添零补位的操作，使卷积核可遍历输入图的每一个像素点，同时卷积核的大小随网络深度的增加逐渐降低；初始卷积核数为128，随着网络深度的增加而增加，挖掘更多的高维特征信息；

3.2)在经过4层卷积层后送入1层全连接层，整合前面各层卷积的视野特征，输出N个类别的分类值；

3.3)最后将步骤3.2)获取的N个类别的分类值通过1层Softmax网络层转化为分类概率，概率最大的类别就是当前样本的分类结果；

4)根据样本数据集对分类器进行训练，过程如下：

4.1)获取损失函数；选取的损失函数基于预测分类和样本标签的交叉熵，其格式采用one-hot编码表示，如[0,0,1,0,0,0]表示的样本的标签为6个类别中的第3个；交叉熵表达式如下：

其中y_i是样本i的标签，y′_i是样本i的预测值，H_i是样本i的交叉熵；首先将样本的预测分类和样本标签的log函数相乘取反，one-hot各维度的熵值累加得到交叉熵；

通过计算所有样本交叉熵的平均值达到当前训练数据的损失函数，表达式如下：

4.2)将步骤2)获取的图像格式的样本输入步骤3)构建好的卷积神经网络分类器进行训练，训练时采用小批量梯度下降的训练方法，每次从训练集中随机选择一批数据用于模型的训练，既可避免随机梯度下降产生的训练震荡，也可避免批量梯度下降对资源的过度消耗，批的大小选择128；考虑到网络更新的稳定性，学习率定为0.001，使用超参数自适应调整的Adam优化器进行训练，训练目标是通过梯度的前向和反向传播调整网络的结构参数，不断降低模型的损失函数值；

4.3)为避免实验偶然性的干扰，实验采用十折交叉验证，即将训练集分成10份，每次选取其中的9份用于训练，一份用于测试，最终对所有结果取平均作为最终的实验结果，恶意软件图像的分类器达到87.17％的分类精度。

2.如权利要求1所述的基于深度学习的恶意软件图像格式检测方法，其特征在于：所述步骤1)中，获取了9个恶意软件家族样本数据集，共10868个恶意软件样本，将恶意软件原始“.asm”后缀的汇编语言文件通过ASCII映射、进制转换、拼接转换为64×64大小的恶意软件灰度图像。

3.如权利要求1所述的基于深度学习的恶意软件图像格式检测方法，其特征在于：在所述步骤3.3)中，除去输入层网络共6层，训练参数共6,780,161个，除去偏置值和全连接层，且实际训练时由于前向、反向计算和优化器的使用，使用的参数量将有所增加；通过网络的层次传递，输入的64×64×1大小的灰度图像数值矩阵，最后输出该样本被分类到N个类别的概率大小。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910886585.4/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于程序逻辑识别同源攻击的方法、装置及存储设备
下一篇：一种恶意脚本检测方法、装置和存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F21-00 防止未授权行为的保护计算机或计算机系统的安全装置
G06F21-02 .通过保护计算机的特定内部部件
G06F21-04 .通过保护特定的外围设备，如键盘或显示器
G06F21-06 .通过感知越权操作或外围侵扰
G06F21-20 .通过限制访问计算机系统或计算机网络中的节点
G06F21-22 .通过限制访问或处理程序或过程

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的恶意软件图像格式检测方法及其装置有效

专利文献下载