[发明专利]对恶意代码检测的方法及系统有效
申请号: | 201910638126.4 | 申请日: | 2019-07-16 |
公开(公告)号: | CN110348214B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 张小松;牛伟纳;赵凌园;李子豪;罗宇恒;杨淳 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62;G06N3/04 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 濮云杉 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 恶意代码 检测 方法 系统 | ||
本发明涉及对恶意代码检测的方法及系统,方法包括:A.对训练数据集中单个PE文件的二进制数据提取相应特征;B.对所述特征降维处理;C.通过门控卷积网络提取二进制数据的特征为深度学习模型前半部分;D.将降维后的特征与步骤C得到的特征向量组合后,输入到作为深度学习模型后半部分的全连接神经网络中,生成最终的待分类特征向量;E.所有的PE文件都生成了对应的待分类特征向量;F.对所有待分类特征向量分类后与测试数据集中已知的类别进行比较以验证深度学习模型的正确性,并通过调整参数获得最优的深度学习模型。本发明能够不受恶意代码指令变换的影响,准确检测出未知软件中是否包含恶意代码,并且还提高了检测效率。
技术领域
本发明涉及软件安全检测的方法和系统,具体讲是对恶意代码检测的方法及系统。
背景技术
在反病毒研究与恶意代码的对抗过程中,恶意代码技术的不断发展也促使了恶意程序检测技术的不断发展与进步,新型恶意代码编写技术也导致了新型检测技术的出现。
深度学习在计算机视觉和语音识别方面都取得了良好的效果。在计算机视觉方面,Krizhevsky等人提出了采用深度卷积神经网络来进行图片分类,Farabet提出了层次学习场景标签的方法,Kavukcuoglu提出了视觉功能的卷积识别方法。
n-gram是自然语言处理领域的概念,早期的语音识别技术和统计语言模型与它密不可分。n-gram基于一个简单的假设,即认为一个词出现的概率仅与它之前的n-1个词有关,这个概率可从大量语料中统计得到。例如“吃”的后面出现“苹果”或“披萨”的概率就会比“公路”的概率大(正常的语料中基本不会出现“吃公路”这种组合)。可以看出n-gram在一定程度上包含了部分语言特征。将n-gram应用于恶意代码识别的想法最早由Tony等人在2004年的论文N-gram-based Detection of New Malicious Code中提出,不过他们的方法是基于ByteCode的。2008年Moskovitch等人的论文Unknown Malcode Detection UsingOPCODE Representation中提出利用opcode(操作码)代替ByteCode更加科学。
传统的基于机器学习进行恶意代码的检测分类方法基本都是进行精确检测,一般方式为提取恶意代码中具有相同点的opcode序列(操作码)作为特征,检测符合特征的恶意代码。而现今的反病毒是一个对抗的过程。众所周知,完成同样功能的opcode指令并不唯一,有些功能存在几个甚至十几个完成同样功能的指令。传统方法是提取精确的opcode指令序列,而一旦其中某个功能的指令被其他指令所替代,则无法检出,因此传统方法很难对抗这种指令变换的恶意代码。
发明内容
本发明提供了一种对恶意代码检测的方法及系统,可以不受恶意代码指令变换的影响,准确检测出软件中是否包含恶意代码,以解决现有技术中无法准确识别一个未知软件是否是恶意软件的问题。
本发明对恶意代码检测的方法,包括步骤:
A.预处理:将预先已获取的包含PE文件(Portable Executable,可移植的可执行的文件)的训练数据集中具有恶意代码的PE文件和正常PE文件分开,对单个PE文件的二进制数据提取相应的特征,包括对应的操作码、API(应用程序接口)调用序列和PE文件头部字段;
B.对所述特征通过层叠降噪自编码器进行降维处理,得到降维后的特征向量;
C.将门控卷积网络作为深度学习模型的前半部分,通过门控卷积网络提取二进制数据的特征,作为深度学习模型前半部分的特征向量;
D.将步骤B得到的降维后的特征向量输入到所述门控卷积网络中,与步骤C得到的深度学习模型前半部分的特征向量进行组合后,作为新的特征输入到作为深度学习模型后半部分的全连接神经网络中,生成最终的待分类特征向量;
E.循环步骤A~步骤D,直到所有的PE文件都生成了对应的待分类特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910638126.4/2.html,转载请声明来源钻瓜专利网。