[发明专利]基于可执行文件线性序列表示的计算机恶意代码检测方法有效
申请号: | 202210496401.5 | 申请日: | 2022-05-09 |
公开(公告)号: | CN114896597B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 许家威;付文轩;布皓羽;王志 | 申请(专利权)人: | 南开大学 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06N3/02 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 张耀 |
地址: | 300350 天津*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 可执行文件 线性 序列 表示 计算机 恶意代码 检测 方法 | ||
1.基于可执行文件线性序列表示的计算机恶意代码检测方法,其特征在于,所述方法包括:
步骤1、将待检测样本进行线性序列表示;
步骤2、将所述线性序列进行规范化处理;
步骤3、将所述线性序列进行填充,并使用线性插值法放缩到指定长度;
步骤4、使用计算机病毒检测模型检测序列的善恶性,得到检测结果,其中,所述计算机病毒检测模型为根据收集到的样本数据集合训练得到的神经网络模型,所述序列为待检测样本按照所述线性序列表示得到的序列;
步骤1所述的将待检测样本进行线性序列表示,是将待检测样本按照二进制形式读取,读取内容为根据其在设备中的存放顺序形成的二进制序列;
步骤2将所述线性序列进行规范化处理,包括:将所述线性序列中的二进制数据按比例缩放,使之落入一个小的特定区间,从而在为后续进行放缩的同时最大程度上保留原本的信息;
步骤3所述的将所述线性序列进行填充,并使用线性插值法放缩到指定长度,包括如下步骤:
第一步、将线性序列进行填充:
在步骤2形成的线性序列首尾填充特定长度的0,使得填充后的线性序列长度为L0;使用线性插值法放缩到指定长度L1;
第二步、线性插值:
1)、确定放缩比S,其中S的计算公式为:S=(L1/L0),其中L1为所述指定长度,L0为所述第一步中所述填充0之后的序列长度;
2)、确定相关像素点数量n,其中n的计算公式为:n=ceil(1/S),其中S为第二步1)中所述放缩比,ceil(1/S)表示将1/S的值进行向上取整;
3)、确定涉及到目标像素点P的n个像素点V={P1……Pn},其中n为第二步2)中所述的相关像素点数量;
4)、使用线性插值法进行放缩,线性插值操作的具体函数表达式为:
其中{x1……xn}分别对应像素点{P1……Pn}的横坐标,{y1……yn}分别对应像素点{P1……Pn}的像素值,k为像素点P对应的横坐标。
2.根据权利要求1所述的基于可执行文件线性序列表示的计算机恶意代码检测方法,其特征在于,步骤4所述的使用计算机病毒检测模型检测序列的善恶性,得到检测结果,包括如下步骤:
1)使用计算机病毒检测模型训练一个二分类的分类器,计算并输出样本为每个类别的概率;
2)确定概率的最大值,判断所述概率是否大于设定阈值;
如果是,则表示待检测样本为超过阈值的类别;
如果否,则表示待检测样本为小于阈值的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210496401.5/1.html,转载请声明来源钻瓜专利网。