[发明专利]一种基于卷积神经网络的恶意软件流量分类方法在审
申请号: | 201910849786.7 | 申请日: | 2019-09-09 |
公开(公告)号: | CN110572393A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 王书州;章丽娟;刘旭;胡漪逸;孟凯强;王亚龙;赵治博;朱晓贝;李维超 | 申请(专利权)人: | 河南戎磐网络科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06N3/04;G06N3/08 |
代理公司: | 11429 北京中济纬天专利代理有限公司 | 代理人: | 刘登科 |
地址: | 450000 河南省郑州市金*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 恶意软件 卷积神经网络 恶意代码 流量分类 全局信息 流量检测技术 恒定 灰度图像 领域专业 流量特性 生成信号 图像分类 信号处理 预先设计 原始数据 单通道 灰度图 分类 映射 学习 转化 分析 | ||
1.一种基于卷积神经网络的恶意软件流量分类方法,其特征在于,该基于卷积神经网络的恶意软件流量分类方法具体包括以下步骤:
步骤一:恶意代码映射为单通道的信号;
步骤二:信号处理生成信号的语谱图;
步骤三:语谱图转化为恒定大小的灰度图;
步骤四:卷积神经网络实现恶意代码的分类。
2.如权利要求1所述的基于卷积神经网络的恶意软件流量分类方法,其特征在于,在步骤一中,所述的恶意代码的映射用到文件属性(fp)对恶意软件分类非常有用,压缩率可以很大程度上描述文件的类型,本文提取了字节文件与反汇编文件大小和压缩率,并且获取了他们的比值。
3.如权利要求1所述的基于卷积神经网络的恶意软件流量分类方法,其特征在于,在步骤二中,所述的语谱图的生成在汇编代码中,软件的行为通常由一些代码关键字符或者字符串(key)决定;程序节、操作码、应用编程接口调用和动态链接库在很大程度上描述了一个软件的行为与目的,这些属性的数量与分布具有一定的规律,统计他们出现的频率,与其占的比例;所述的语谱图的生成中用到熵;所述的熵(ent)是信息不确定性的一个测度,熵越大则表示信息的不确定程度越高。
4.如权利要求1所述的基于卷积神经网络的恶意软件流量分类方法,其特征在于,在步骤三中,所述的使用图像缩放算法将语谱图转化为恒定大小的灰度图。
5.如权利要求4所述的基于卷积神经网络的恶意软件流量分类方法,其特征在于,在步骤三中,所述的恶意软件可以通过将每个字节解释为图像中的一个像素而把字节文件形象转化为灰度图像,将字节表示为像素,很容易可以得到图像的像素强度,因此提取图像的前300~600像素强度作为特。
6.如权利要求1所述的基于卷积神经网络的恶意软件流量分类方法,其特征在于,在步骤四中,所述的分类用的分类器分别是常用的ExtraTreesClassiffier、支持向量机和一种渐进回归树的优化算法xgboost,对比多种分类器,最终实验使用多分类器融合,使用80%的xgboost和20%的ExtraTreesClassiffier作为分类算法。
7.如权利要求1所述的基于卷积神经网络的恶意软件流量分类方法,其特征在于,在步骤二中,应用到N-gram,所述的N-gram是NLP领域中非常重要的一个概念,N-gram的一个主要作用是评估2段文字之间的差异程度,是模糊匹配中最常用的一种手段。
8.如权利要求1所述的基于卷积神经网络的恶意软件流量分类方法,其特征在于,在步骤四中,所述的分类用的分类器分别是常用的ExtraTreesClassiffier、支持向量机和一种渐进回归树的优化算法xgboost,对比多种分类器,最终实验使用多分类器融合,使用80%的xgboost和20%的ExtraTreesClassiffier作为分类算法。
9.如权利要求1所述的基于卷积神经网络的恶意软件流量分类方法,其特征在于,在步骤二中,所述的语谱图的生成中用到熵;所述的熵(ent)是信息不确定性的一个测度,熵越大则表示信息的不确定程度越高。
10.如权利要求1所述的基于卷积神经网络的恶意软件流量分类方法,其特征在于,在步骤二中,所述的熵压缩了字节文件中每4kB块的字节,使用香农公式计算每块的熵e作为特征:
其中,p(i)代表这一块中字节i的频率;m代表窗口内不同字节的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南戎磐网络科技有限公司,未经河南戎磐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910849786.7/1.html,转载请声明来源钻瓜专利网。