[发明专利]基于编程模式和模式匹配的漏洞聚类方法有效
申请号: | 201510443533.1 | 申请日: | 2015-07-27 |
公开(公告)号: | CN105045715B | 公开(公告)日: | 2018-01-12 |
发明(设计)人: | 张小松;宋珺;牛伟纳;卓中流;陈瑞东;孙恩博;戴中印;黄金 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 电子科技大学专利中心51203 | 代理人: | 李明光 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 编程 模式 匹配 漏洞 方法 | ||
1.一种基于编程模式和模式匹配的漏洞聚类的方法,具体包括以下步骤:
步骤1.编程模式提取;记已知存在漏洞的函数为函数F,对于一个包含(Cf—1)个函数的程序源代码,进行如下步骤的操作:
步骤1-1:将函数F置于所述程序源代码中,此时程序源代码包含有Cf个函数,统计插入函数F后的程序源代码中出现的不同关键词并记其总数量为Cn,所述关键词类型包括保留字、函数名、变量名;
步骤1-2:为该程序源代码的每个函数创建一个维度为Cn的列向量Mi,i=1,2,…Cf,列向量Mi中的每个元素与步骤1-1所统计的不同关键词一一对应,若列向量Mi对应的函数中包含有相应关键词,则列向量Mi中相应位置的元素值记为1,否则记为零;将创建的Cf个列向量合并为一个Cn×Cf的矩阵M;
步骤1-3:选取特征数值D,0<D≤Cf;
步骤1-4:对矩阵M进行截断奇异值分解M=USVT,并取前D个奇异值,分解之后得到矩阵U、S、V;其中,矩阵U为Cn*D阶矩阵,矩阵S为D*D阶对角矩阵,矩阵V为Cf*D阶矩阵;
矩阵V的每一个行向量与所述程序源代码中的每一个函数一一对应,即矩阵V的每一个行向量代表所述程序源代码中的一个函数的模式块,由此得到Cf个与程序源代码的函数一一对应的模式块向量,提取其中与函数F对应的模式块向量;
步骤2.模式匹配聚类;对于步骤1中提取出的Cf个函数的模式块向量,进行如下步骤的操作:
步骤2-1:针对程序源代码中除函数F之外的函数所对应的模式块向量,计算每个模式块向量Fi与函数F的模式块向量的欧氏距离;
步骤2-2:设定欧氏距离阈值δ,将与函数F的模式块向量的欧氏距离小于等于阈值δ的模式块向量对应的函数提取出来,即将程序源代码中与带有漏洞的函数F具有较近欧氏距离即较高相似度的函数聚类为一类,供进一步分析。
2.根据权利要求1所述的基于编程模式和模式匹配的漏洞聚类的方法,其特征在于,所述欧氏距离S(Fi,F)的具体公式如下:
其中,向量(a1 a2…aD)、(b1 b2…bD)分别为模式块向量Fi及函数F的模式块向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510443533.1/1.html,转载请声明来源钻瓜专利网。