[发明专利]云环境下基于Java字节码的多粒度代码克隆检测方法有效
申请号: | 201710156441.4 | 申请日: | 2017-03-16 |
公开(公告)号: | CN106919403B | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 俞东进;陈耀旺 | 申请(专利权)人: | 杭州鹿径科技有限公司 |
主分类号: | G06F8/75 | 分类号: | G06F8/75 |
代理公司: | 33272 杭州奥创知识产权代理有限公司 | 代理人: | 王佳健 |
地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 环境 基于 java 字节 粒度 代码 克隆 检测 方法 | ||
1.云环境下基于Java字节码的多粒度代码克隆检测方法,其特征在于包括如下步骤:
步骤(1)获取云环境下分布于不同地点的Java源代码,编译得到它们的字节码文件即.class文件,并通过javap命令将.class文件转换为txt格式文件;
步骤(2)提取步骤(1)中所得到的txt格式文件中的方法与代码块,其中,通过直接读取每个方法所对应的字节码指令提取方法,形成方法粒度;通过控制转移指令分析提取代码块,形成代码块粒度;
步骤(3)根据Java字节码指令的分类构建字节码指令的分类层次架构并进行编码,该架构主要分为三层:第一层是Java字节码指令中除Type之外的其余九个大类,第二层是对每个大类进行的详细子类划分,第三层则是对应的字节码指令;
步骤(4)对步骤(2)所提取出的两种粒度的代码段进行特征提取,主要提取的特征包括指令序列IS=(I1,I2,I3,...,Ii,...,Ik)与方法调用序列MCS={M1,M2,M3,...,Mi,...,Mr},其中i、k、r为自然数;
在特征提取之后使用字节码分类层次架构对指令序列进行归一化处理,将指令序列转化为一级指令序列与二级指令序列,其中一级指令序列对应分类层次架构中的第一层Java字节码指令大类,二级指令序列对应分类层次架构中的第二层Java字节码指令子类;
步骤(5)对于方法或代码块,利用步骤(4)得到的指令序列与方法调用序列,分别进行Type-1、Type-2克隆检测与Type-3克隆检测。
2.根据权利要求1所述的云环境下基于Java字节码的多粒度代码克隆检测方法,其特征在于:步骤(1)中每个txt格式文件包含一个或多个Java方法,每个方法都由一系列字节码指令以及相关的方法调用构成。
3.根据权利要求1所述的云环境下基于Java字节码的多粒度代码克隆检测方法,其特征在于:步骤(5)在Type-1、Type-2克隆检测中,首先计算两个代码段的二级指令序列的哈希值,如果哈希值相等,再比较两个代码段的方法调用序列,如果方法调用序列中的方法个数相同并且每个方法的参数个数也相同,则这两个代码段为代码克隆实例。
4.根据权利要求1所述的云环境下基于Java字节码的多粒度代码克隆检测方法,其特征在于:步骤(5)在Type-3克隆检测中,分别计算两个代码段的一级指令序列相似度、二级指令序列相似度与方法调用序列相似度,然后对一级指令序列相似度、二级指令序列相似度赋予不同的权值并累计确定指令序列相似度,再将指令序列相似度与方法调用序列相似度赋予不同的权值并累计来确定最终的代码段相似度值,如果最终的相似度值超过预先设定的阈值,则它们为代码克隆实例。
5.根据权利要求4所述的云环境下基于Java字节码的多粒度代码克隆检测方法,其特征在于:使用编辑距离计算一级指令序列相似度、二级指令序列相似度。
6.根据权利要求4所述的云环境下基于Java字节码的多粒度代码克隆检测方法,其特征在于:在计算两个方法调用序列相似度时,采用递归的方式将两个方法调用序列的相似度计算转换成这两个方法调用序列中每个方法所对应的代码段的相似度的计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州鹿径科技有限公司,未经杭州鹿径科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710156441.4/1.html,转载请声明来源钻瓜专利网。