[发明专利]一种基于编码序列表示的源代码片段成对比较方法有效
申请号: | 202011324413.7 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112416431B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 黄志球;喻垚慎;李伟湋;沈国华;邵宜超 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F8/75 | 分类号: | G06F8/75 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 姜晓钰 |
地址: | 211106 江苏省南京市江宁区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于编码序列表示的源代码片段成对比较方法,属于计算机程序技术领域,使用一种基于静态程序分析的编码序列源代码表示方法,将源代码文本转换为编码序列表示;用Burrows‑Wheeler转换,对源代码片段的编码序列进行数据处理,得到编码序列的索引;通过种子筛选,从编码序列的索引中找出具有高相似度的子序列比对种子;用Smith‑Waterman算法,将高相似度种子作为子序列比对的起始位置,扩展后续序列中保持一定相似度阈值的子序列;根据编码序列对应的源代码行号信息,定位源代码片段之间的高相似度部分,解决了无法支持跨粒度相似度匹配,高相似度片段定位不够精确的技术问题,能够支持跨粒度源代码相似性比较,不要求对比的源代码文本具有同一粒度。 | ||
搜索关键词: | 一种 基于 编码 序列 表示 源代码 片段 成对 比较 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011324413.7/,转载请声明来源钻瓜专利网。