[发明专利]一种基于深度森林的恶意代码分类方法有效

专利信息
申请号: 201811187770.6 申请日: 2018-10-12
公开(公告)号: CN109344618B 公开(公告)日: 2021-10-08
发明(设计)人: 钱叶魁;卢喜东;杜江;杨瑞朋;黄浩;雒朝峰;宋彬杰;李宇翀 申请(专利权)人: 中国人民解放军陆军炮兵防空兵学院郑州校区
主分类号: G06F21/56 分类号: G06F21/56;G06K9/62
代理公司: 深圳市威世博知识产权代理事务所(普通合伙) 44280 代理人: 李庆波
地址: 450052 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 森林 恶意代码 分类 方法
【说明书】:

发明公开了基于深度森林的恶意代码分类方法,属于网络安全技术领域,包括步骤:数据预处理,将恶意代码二进制文件映射为图像,并对图像进行缩放和标准化处理;提取图像的HOG特征向量集;将HOG特征向量集转化为矩阵,并且分为训练集和测试集;构建随机森林;构建完全随机森林;构建深度森林,深度森林由多粒度扫描和级联森林两部分组成的多层结构,每层结构由相等数量的随机森林和完全随机森林组成;用深度森林对所述图像进行分类。本申请充分利用了恶意代码图像的空间相似性。使本申请的基于深度森林的恶意代码分类方法在分类的准确率、宏F1度量上的精度都很高,并且本申请通过利用深度森林不同大小的窗口扫描HOG特征矩阵,也解决了二进制文件重新分配的问题。

技术领域

本发明属于网络安全技术领域,特别是涉及一种对恶意代码进行分类的方法。

背景技术

随着互联网的蓬勃发展,恶意代码已经成为威胁互联网安全的主要因素之一。通过将恶意代码映射为图像后属于同一家族的恶意代码图像具有视觉相似性,不同家族的恶意代码图像之间具有一定的差异性,根据恶意代码图像的这一特点,可以提取恶意代码图像特征并使用分类算法对恶意代码进行分类。例如Nataraj L等人将恶意代码二进制文件映射为图像,利用Gabor滤波器多尺度和多方向的特点提取图像的全局特征,然后使用最近邻算法对恶意代码进行分类。Kancherla K等人将恶意代码图像的强度特征和小波特征与Gabor滤波器提取的全局特征结合,然后使用这三种特征对恶意代码进行分类。Han K S等人将恶意代码图像的熵值映射到曲线上,然后计算曲线的相似度对恶意代码分类。Farrokhmanesh M等人将恶意代码映射为灰度图,使用三种哈希算法提取恶意代码的指纹,然后计算图像指纹之间的距离对恶意代码分类。但是上述对恶意代码分类的方法不能解决恶意代码二进制文件重新分配的问题,以及上述分类方法的分类精度还略低。

发明内容

本发明主要解决的技术问题是提供一种分类精度高的基于深度森林的恶意代码分类方法,并且解决恶意代码二进制文件重新分配的问题。

为解决上述技术问题,本发明的基于深度森林的恶意代码分类方法包括以下步骤:

步骤一:数据预处理,将恶意代码二进制文件映射为图像,并对所述图像进行缩放和标准化处理;

步骤二:提取所述图像的HOG特征向量集f;

步骤三:将所述HOG特征向量集转化为矩阵,并且分为训练集和测试集;

步骤四:构建随机森林;

步骤五:构建完全随机森林;

步骤六:构建深度森林,所述深度森林由多粒度扫描和级联森林两部分组成的多层结构,每层结构的多粒度扫描和级联森林均包括相等数量的随机森林和完全随机森林,所述训练集用于训练深度森林,所述测试集用于评估所述深度深林;

步骤七:用深度森林对所述图像进行分类,即完成对所述图像对应的恶意代码的分类。

进一步优选地,在步骤一中,将恶意代码二进制文件映射为图像的过程包括以下步骤:

步骤1-1:对所述恶意代码二进制文件,读取8bit为一个无符号的整型,固定的行宽为一个向量,生成一个二维数组;

步骤1-2:所述二维数组的每个元素范围取值为[0,255],其中0表示黑色,255表示白色,将所述二维数组可视化为一个灰度图像;

步骤1-3:所述灰度图像保存为无压缩的图像。

进一步优选地,在步骤一中,对所述图像进行缩放处理采用双三次插值法,选取所述图像待插值点周围16个点的灰度值作为三次插值,构造基函数的公式为:

双三次插值公式为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军炮兵防空兵学院郑州校区,未经中国人民解放军陆军炮兵防空兵学院郑州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811187770.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top