[发明专利]一种基于质量保证框架的代码摘要集成方法在审
申请号: | 202110656618.3 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113282336A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 鄢萌;胡予星;毕霁超;刘忠鑫;陈秋远;王备;雷晏;徐玲 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F8/72 | 分类号: | G06F8/72 |
代理公司: | 重庆晟轩知识产权代理事务所(普通合伙) 50238 | 代理人: | 王海凤 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 质量保证 框架 代码 摘要 集成 方法 | ||
1.一种基于质量保证框架的代码摘要集成方法,其特征在于:包括如下步骤:
S100:对于一个待测代码段codei,选择I种现有代码摘要方法生成相对应的I个候选代码摘要
S200:基于协同过滤的组件,针对每一个候选代码摘要分别计算两个质量分数Precisioni和Recalli;
基于检索的组件,针对每一个候选代码摘要计算质量分数REScorei;
S300:利用每个候选代码摘要的质量分数Preisioni和Recalli,计算该候选代码摘要的调和平均数F1scorei;
S400:从I个候选代码摘要中选择质量最好的一个作为最终的输出结果sumbest,具体过程如下:
将I个候选代码摘要的F1scorei值进行对比,将最高F1scorei值所对应的候选代码摘要作为待测代码段codei的最终代码摘要结果sumbest;
如果所对比的候选代码摘要的F1scorei值相等,则对比候选代码摘要的REScorei值,将最高REScorei值所对应的候选代码摘要作为待测代码段codei的最终代码摘要结果sumbest;
如果所对比候选代码摘要的F1scorei值和REScorei值都相等,则任选一个候选代码摘要作为待测代码段codei的最终代码摘要结果sumbest。
2.如权利要求1所述的一种基于质量保证框架的代码摘要集成方法,其特征在于:所述S200中基于协同过滤的组件,针对每一个候选代码摘要分别计算两个质量分数Precisioni和Recalli的具体步骤如下:
S210:获取历史代码数据,所述历史代码数据由代码段codeh、参考摘要sumref和生成摘要sumgen组成;
S211:通过单词wd构建N维的单词向量所述单词wd为历史数据中codeh包含的单词,具体定义如下:
其中,表示在第j个历史代码中包含单词wd,N表示历史数据的数量;
通过单词ws构建N维的单词向量所述单词ws为历史数据中sumref包含的单词,具体定义如下:
其中,表示在第j个历史代码的参考摘要中包含单词ws,N表示历史数据的数量;
S212:计算单词wd和ws之间的关联性Rel(wd,ws),具体表达式如下:
S213:构建单词wd映射表定义表达式如下:
S214:分别计算每一个候选代码摘要两个质量分数Precisioni和Recalli,具体表达式如下:
其中,|·|表示一个集合的长度。
3.如权利要求1所述的一种基于质量保证框架的代码摘要集成方法,其特征在于:所述S200中基于检索的组件,针对每一个候选代码摘要计算质量分数REScorei的具体步骤如下:
S220:使用词频-逆文档频率,将历史数据中的代码段表示为向量具体表达式如下:
其中,#w表示单词的总数量,表示历史数据中包含单词wd的code数量;
将待测数据中的代码段codei表示为向量di,具体表达式如下:
其中,#codei|wd∈codei表示待测数据中包含单词wd的code数量;
S221:计算待测代码段codei与每一个历史代码之间的相似程度值获得J个相似程度值,具体计算表达式如下:
S222:将S221得到的J个相似程度值进行降序排列,选择前n个相似程度值对应的历史代码并记为至
S223:计算待测代码段codei与前n个历史代码的相关性分数,所得结果记为该待测代码段codei的质量分数REScorei,具体表达式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110656618.3/1.html,转载请声明来源钻瓜专利网。