[发明专利]一种基于功能相似度匹配的代码搜索方法有效
申请号: | 201910828507.9 | 申请日: | 2019-09-03 |
公开(公告)号: | CN110716749B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 李必信;杜成杰;孔祥龙;王璐璐;廖力;周颖 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F8/75 | 分类号: | G06F8/75;G06F16/332;G06F16/38 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于功能相似度匹配的代码搜索方法,针对输入是自然语言查询的情况,对代码库中的代码进行功能信息的挖掘,挖掘代码片段的功能注释与功能API这两个特征来度量代码片段和查询语句的功能相似度,结合代码片段的方法名和方法体两个特征,根据不同特征的重要性分配不同的权重,计算查询和与代码片段的总的相似度得分,按照得分高低排序,把搜索结果返回给用户。充分考虑并挖掘了源代码中包含的功能信息,并根据重要性分配权重,使得匹配精度更高。 | ||
搜索关键词: | 一种 基于 功能 相似 匹配 代码 搜索 方法 | ||
【主权项】:
1.一种基于功能相似度匹配的代码搜索方法,其特征在于,该方法包括如下步骤:/n步骤1)对代码库中的源码,以方法为粒度切分,进行简单特征提取,提取每个方法的方法名和方法体两个特征,分别表示方法名和方法体中出现的特征关键字;/n步骤2)分析项目源代码,挖掘代码片段的功能信息,提取功能注释和功能API两个特征;/n步骤3)输入自然语言查询进行搜索时,为不同的代码特征分配不同的权重,采用余弦相似度算法,分别计算查询语句和代码片段的原始相似度和功能相似度;/n步骤4)为原始相似度和功能相似度分配权重并计算最后的总的相似度得分,根据得分高低对搜索结果进行排序返回给用户。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910828507.9/,转载请声明来源钻瓜专利网。