[发明专利]一种基于子块过滤的分布式代码克隆检测与搜索方法、系统及介质有效
申请号: | 202011078655.2 | 申请日: | 2020-10-10 |
公开(公告)号: | CN112148359B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 任怡;杨立明;谭郁松;汪哲;李宝;阳国贵;黄辰林;魏旭鹏;周洁;陈梓榕;王瑞;董攀;张建锋;王晓川;丁滟;谭霜;蹇松雷 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F8/75 | 分类号: | G06F8/75;G06F16/31;G06F16/33 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 谭武艺 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于子块过滤的分布式代码克隆检测与搜索方法、系统及介质,本发明方法包括对用户代码和代码库源代码分别分组并行进行预处理得到包含Token及其频率信息的中间文件;根据所有中间文件建立全局Token频率表;将代码库源代码的代码块利用全局Token频率表分组并行处理,建立索引得到索引库;利用子块过滤机制,从用户代码中提取出关键字查询索引库,得到用户代码的代码块所对应的候选集;针对用户代码中的每一个代码块,计算该代码块与其对应的候选集中的每一个候选代码块之间的相似度,若相似度超过预设则判定为克隆对。本发明具有检测语言无关的特性,检测和搜索效率高,适用于大规模代码的克隆检测及搜索,支持用户查询代码。 | ||
搜索关键词: | 一种 基于 过滤 分布式 代码 克隆 检测 搜索 方法 系统 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011078655.2/,转载请声明来源钻瓜专利网。