[发明专利]代码相似函数检测方法、装置、电子设备及存储介质在审
申请号: | 202110983815.6 | 申请日: | 2021-08-25 |
公开(公告)号: | CN115729797A | 公开(公告)日: | 2023-03-03 |
发明(设计)人: | 刘江虹 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F8/41;G06F8/75 |
代理公司: | 上海光栅知识产权代理有限公司 31340 | 代理人: | 关浩;马雯雯 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 代码 相似 函数 检测 方法 装置 电子设备 存储 介质 | ||
本公开实施例提供一种代码相似函数检测方法、装置、电子设备及存储介质,该方法通过解析待检测代码,得到抽象语法树;通过遍历抽象语法树,得到抽象语法树中至少两个子树,子树用于表征待检测代码中的函数体;根据各子树的节点,确定至少两个相似子树,并将至少两个相似子树对应的函数体,确定为相似函数,其中,各相似子树的对应节点的类型相同,由于将待检测代码转换为了抽象语法树,并基于对抽象语法树的静态分析,确定了节点的类型相同的相似子树,从而保证相似子树对应的函数体所实现的功能相同,进而根据相似子树所对应的函数体确定对应的相似函数,实现了对功能相同的相似函数的检测,提高了代码重复度检测的精确性。
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种代码相似函数检测方法、装置、电子设备及存储介质。
背景技术
目前,在前端项目质量检测过程中,代码的重复度是一项很重要的指标,随着项目的不断开发迭代和功能累加,重复代码会逐渐出现,而过高的代码重复度,会导致项目的稳定性降低,提高项目维护成本。
现有技术中,对代码的重复度检测,通常是通过开源的代码检测功能库,对代码进行完全克隆检测,但这种方案只能检测出代码中完全一致的函数,而无法对功能相同,但参数、函数名不同的相似函数进行检测,导致代码的重复率检测准确性低的问题。
发明内容
本公开实施例提供一种代码相似函数检测方法、装置、电子设备及存储介质,以克服无法对相似函数进行检测的问题。
第一方面,本公开实施例提供一种代码相似函数检测方法,包括:
解析待检测代码,得到抽象语法树;通过遍历所述抽象语法树,得到所述抽象语法树中至少两个子树,所述子树用于表征所述待检测代码中的函数体;根据各所述子树的节点,确定至少两个相似子树,并将所述至少两个相似子树对应的函数体,确定为相似函数,其中,各所述相似子树的对应节点的类型相同。
第二方面,本公开实施例提供一种代码相似函数检测装置,包括:
解析模块,用于解析待检测代码,得到抽象语法树;
遍历模块,用于通过遍历所述抽象语法树,得到所述抽象语法树中至少两个子树,所述子树用于表征所述待检测代码中的函数体;
确定模块,用于根据各所述子树的节点,确定至少两个相似子树,并将所述至少两个相似子树对应的函数体,确定为相似函数,其中,各所述相似子树的对应节点的类型相同。
第三方面,本公开实施例提供一种电子设备,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的代码相似函数检测方法。
第四方面,本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的代码相似函数检测方法。
第五方面,本公开实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能的设计所述的代码相似函数检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110983815.6/2.html,转载请声明来源钻瓜专利网。