[发明专利]一种基于层次注意力网络模型的恶意软件分类方法在审

申请号：	202110107338.7	申请日：	2021-01-27
公开（公告）号：	CN112668009A	公开（公告）日：	2021-04-16
发明（设计）人：	孙玉霞;陈钊;陈新凯;林松;翁健	申请（专利权）人：	暨南大学
主分类号：	G06F21/56	分类号：	G06F21/56;G06F8/53
代理公司：	深圳科湾知识产权代理事务所(普通合伙) 44585	代理人：	钟斌
地址：	510630 ***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于层次注意力网络模型恶意软件分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于层次注意力网络模型的恶意软件分类方法，其特征在于，所述方法包括以下步骤：

S1对恶意软件PE样本进行反汇编，对应的获取汇编代码文件；

S2从所述汇编代码文件中提取操作码序列，生成操作码序列文档；

S3对所述操作码序列文档中的每一个操作码进行词嵌入，即生成词向量；

S4将操作码序列文档送入层次注意力网络模型，输出注意力权重矩阵和分类结果；

S5根据注意力权重矩阵对操作码序列进行图片可视化，通过权重矩阵的权重值大小对应的颜色深浅说明每个操作码、每个操作码序列对于分类的重要性。

2.根据权利要求1所述的基于层次注意力网络模型的恶意软件分类方法，其特征在于，将操作码视为词，代码文件中的基本块视为句。

3.根据权利要求1所述的基于层次注意力网络模型的恶意软件分类方法，其特征在于，所述步骤S1中，使用IDA pro工具对PE恶意软件进行反汇编，获取对应的IntelX86汇编格式代码文件。

4.根据权利要求1所述的基于层次注意力网络模型的恶意软件分类方法，其特征在于，所述步骤S2中，从汇编代码文件中提取.text代码段中的操作码序列，在去除“align、dd、db、dw”四个操作码后，生成操作码序列文档。

5.根据权利要求1所述的基于层次注意力网络模型的恶意软件分类方法，其特征在于，所述步骤S3中，词嵌入操作使用Word2Vec模型作为词嵌入模型并采用CBOW算法实现；所述模型作为步骤S4中层次注意力网络模型的嵌入层使用。

6.根据权利要求1所述的基于层次注意力网络模型的恶意软件分类方法，其特征在于，所述步骤S4中，层次注意力网络模型包括输入层，嵌入层、词编码层，词注意力层，句编码层，句注意力层与输出层；其中，输入层接收操作码序列文档作为输入，嵌入层使用步骤S3中使用的Word2Vec模型，对操作码序列文档的每个操作码索引输出词向量，词编码层和句编码层使用BiGRU循环神经网络层，词注意力层和句注意力层均使用注意力机制，分别输出词注意矩阵和句注意矩阵并保存，供步骤S5使用；在输出层，使用softmax激活函数，输出模型预测的家族类别。

7.根据权利要求1所述的基于层次注意力网络模型的恶意软件分类方法，其特征在于，所述步骤S5中，使用LaTeX语法来实现可视化；其中，从词注意矩阵和句注意矩阵中，可以得到操作码和句子中在分类的相应权重，使用LaTeX语法将操作码序列文档可视化为图片，在可视化图片中，操作码和句子上颜色的深浅由相应的权重确定。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于暨南大学，未经暨南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110107338.7/1.html，转载请声明来源钻瓜专利网。

上一篇：一种SSL传输方法
下一篇：用于预测小耳畸形发生概率的组合物的应用方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F21-00 防止未授权行为的保护计算机或计算机系统的安全装置
G06F21-02 .通过保护计算机的特定内部部件
G06F21-04 .通过保护特定的外围设备，如键盘或显示器
G06F21-06 .通过感知越权操作或外围侵扰
G06F21-20 .通过限制访问计算机系统或计算机网络中的节点
G06F21-22 .通过限制访问或处理程序或过程

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于层次注意力网络模型的恶意软件分类方法在审

专利文献下载