[发明专利]一种基于函数调用关系图的代码同源性分析方法有效
申请号: | 201811212440.8 | 申请日: | 2018-10-18 |
公开(公告)号: | CN109542508B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 付才;张哲畅;胡启宬;韩兰胜;刘铭;崔永泉;骆婷;汤学明 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F8/74 | 分类号: | G06F8/74 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智;曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 函数 调用 关系 代码 同源性 分析 方法 | ||
1.一种基于函数调用关系图的代码同源性分析方法,其特征在于,该方法包括以下步骤:
S1.基于代码的函数调用关系图,生成函数调用关系图的母图;
S2.计算函数调用关系图与母图之间的相对编辑距离;
S3.计算函数调用关系图对应矩阵的半方差值;
S4.计算函数调用关系图的度分布有序值;
S5.基于相对编辑距离、半方差值、度分布有序值三者的中至少一个,分析代码同源性;
所述计算函数调用关系图与母图之间的相对编辑距离包括以下步骤:
S201.编辑距离DE初始为0;
S202.从函数调用关系图的顶层开始,依次检查每个层次所有节点的子节点,当前检查层次记为l,每检查到函数调用关系图中的一个l层节点的子节点对应到母图中的层数不是l+1层,则编辑距离DE增加1;
S203.按照层次遍历所有节点,得到编辑距离DE;
S204.基于编辑距离DE,按照下列公式计算相对编辑距离DRE;
式中,n为函数的总个数;
基于相对编辑距离分析代码同源性的方式如下:相对编辑距离越小,函数调用关系图与母图的相似性越高,程序的层次性越好,从代码的逻辑角度认为它更清晰;反之,函数调用关系图与母图之间的相似性越低,那么函数调用的层次性越差,从代码的逻辑角度认为它更混乱;
基于半方差值分析代码同源性的方式如下:
当函数总数n在1×101~1×102的时候,若半方差值γ5×10-3,认为属于广度优先编写者;若半方差值γ7.5×10-3,认为属于深度优先编写者;
当函数总数n在5×102~2.5×103的时候,若半方差值γ5×10-4,认为属于广度优先编写者,若半方差值γ7.5×10-4,认为属于深度优先编写者。
2.如权利要求1所述的代码同源性分析方法,其特征在于,所述基于代码的函数调用关系图,生成函数调用关系图的母图为:
按广度优先遍历函数调用关系图,在遍历过程中对图进行操作,即第一次寻到某函数时标记该函数所在层数,即可得到母图。
3.如权利要求1所述的代码同源性分析方法,其特征在于,所述计算函数调用关系图对应矩阵的半方差值包括以下步骤:
S301.基于函数调用关系图,生成函数调用矩阵Xn×n;
S302.计算函数调用矩阵的半方差值γ;
式中,h为每一步计算的距离值,取值范围为N(h)为抽样间隔等于h时的点对数,n为函数的总个数,Xi,j为函数调用矩阵Xn×n第i行第j列矩阵元素。
4.如权利要求3所述的代码同源性分析方法,其特征在于,所述基于函数调用关系图,生成函数调用矩阵Xn×n,具体如下:
(1)按照代码的编写顺序的先后,将函数升序地定义为函数调用矩阵的列名、行名;
(2)根据函数调用关系图,判断第i行对应的函数是否调用了第j列对应的函数,若是,则矩阵元素Xi,j为1;否则,矩阵元素Xi,j为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811212440.8/1.html,转载请声明来源钻瓜专利网。