[发明专利]一种面向多态蠕虫病毒的自动检测方法在审
申请号: | 201911272282.X | 申请日: | 2019-12-12 |
公开(公告)号: | CN111177724A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 王方伟;杨少杰;王长广;李青茹;黄文艳;李军 | 申请(专利权)人: | 河北师范大学 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;H04L29/06 |
代理公司: | 石家庄新世纪专利商标事务所有限公司 13100 | 代理人: | 董金国 |
地址: | 050024 河*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 蠕虫 病毒 自动检测 方法 | ||
1.一种面向多态蠕虫病毒的自动检测方法,其特征在于包括如下步骤:
步骤1、选定训练用多态蠕虫数据序列,利用N-gram平滑算法对训练序列进行平滑,然后提取得到特征序列,具体操作分为以下分步骤:
1.1)首先根据流量规范,将训练序列进行切分;
1.2)利用N-gram平滑算法对切分得序列进行数据平滑;
1.3)对平滑后的数据进行特征提取,得到特征序列;
步骤2、利用Gaussian-Bernoulli RBM算法对步骤1中得到的特征序列进行降噪处理并提取特征形成低噪声条件下的多态蠕虫特征序列,具体操作分为以下分步骤:
2.1)首先利用Gaussian-Bernoulli RBM算法对步骤1中得到的特征序列进行降噪处理得到降噪特征序列;
2.2)利用Gaussian-Bemoulli RBM算法对所述降噪特征序列进行特征提取,得到低噪声条件下多态蠕虫特征序列。
步骤3、重复步骤2,得到一系列多态蠕虫特征序列形成特征库。
2.根据权利要求1所述的一种面向多态蠕虫病毒的自动检测方法,其特征在于分步骤1.2中所述N-gram平滑算法为Laplace N-gram算法或Good-TuringN-gram算法。
3.根据权利要求2所述的一种面向多态蠕虫病毒的自动检测方法,其特征在于所述Laplace N-gram算法的平滑公式为:
其中,P(xi)为算某个词xi出现的概率,C(xi)为词xi在训练用多态蠕虫数据序列中出现的次数,V表示拉普拉斯平滑参数。
4.根据权利要求3所述的一种面向多态蠕虫病毒的自动检测方法,其特征在于V的取值范围为:1~0.0001。
5.根据权利要求2所述的一种面向多态蠕虫病毒的自动检测方法,其特征在于分步骤1.2中所述Good-Turing N-gram算法的平滑公式为:
其中,P(xi)为算某个词xi出现的概率,λ为随机线性差值,λ1、λ2、λ3满足随机分配且和一定为1。
6.根据权利要求1所述的一种面向多态蠕虫病毒的自动检测方法,其特征在于步骤2中Gaussian-Bernoulli RBM算法的构造具体分为以下分步骤:
分步1:构造RBM算法:RBM联合概率分布函数如式(3)所示:
其中,变量v,h是玻尔兹曼机n维二值随机向量x∈{0,1}n分解的两个子集:可视层层v和隐藏层层h,E和Z分别表示能量函数和配分函数的归一化常数,其公式如式(4)和(5)所示:
E(v,h)=-vTWh-bTv-cTh (4)
Z=∑v∑h exp{-E(v,h)} (5)
W是该模型参数的权重矩阵,b、c为偏置向量;
综合式(3)、(4)、(5)可得式(6):
分步2:构造Bernoulli RBM算法:Bernoulli RBM概率分布函数如(7)所示:
此时,σ表示为x为v或h;
分步3:构造Gaussian-Bemoulli RBM算法:采用精度矩阵参数化高斯分布,则算法的概率分布函数公式如式所示:
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北师范大学,未经河北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911272282.X/1.html,转载请声明来源钻瓜专利网。