[发明专利]一种基于随机森林分类器的代码评审人推荐系统及方法有效

专利信息
申请号: 202010373726.5 申请日: 2020-05-06
公开(公告)号: CN111428142B 公开(公告)日: 2023-07-28
发明(设计)人: 马瑾瑜;张贺;杨岚心;荣国平;邵栋 申请(专利权)人: 南京大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F11/36;G06F8/77;G06F18/243
代理公司: 北京华际知识产权代理有限公司 11676 代理人: 曹书华
地址: 210093 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 随机 森林 分类 代码 评审 推荐 系统 方法
【说明书】:

发明公开了一种基于随机森林分类器的代码评审人推荐系统及方法,本系统包括:输入模块、计算模块、模型训练模块、推荐结果输出模块,同时提出一种基于随机森林分类器的代码评审人推荐方法,包括输入项目历史代码评审记录;根据历史代码评审记录,挖掘人员活跃度、代码变更和文件权重特征;以项目历史评审记录的评审人作为分类标签,将计算好的特征向量作为数据集,将训练集输入随机森林模型中训练分类模型;从待评审代码变更中抽取特征,输入分类器,输出概率最高的N个类别作为推荐评审人。本发明实现了在大型项目中,根据历史评审记录,为待评审代码变更推荐合适的评审人,为评审人选择提供参考依据并节约沟通成本。

技术领域

本发明涉及软件开发技术领域,具体是一种基于随机森林分类器的代码评审人推荐系统及方法。

背景技术

代码评审作为保障代码质量的一种重要手段,其重要地位在大多数软件公司中日益凸显,然而,选择评审人的过程通常需要耗费一定的沟通时间,如何及时找到合适的评审人成为了代码评审实践中的一个重要的问题,有时候评审人的选择不够合理可能会为后续交付带来许多问题。合适的代码评审人员需要对提交的代码有一定的相关知识储备和熟悉程度,同时,大型项目通常会涉及大量的开发人员,如何从大量候选人中选择合适的评审人成为了软件开发实践中的一个困难。

目前的评审人推荐方法主要包括两类:基于既定规则的推荐方法和基于机器学习的推荐方法。基于规则的方法通常只能从较为单一的角度挖掘评审人选择规律用于推荐,其推荐效果通常不够理想;而基于机器学习的推荐方法虽然可以从多角度综合分析评审人选择策略,提高推荐效果,但目前常用的评审人推荐规则却难以融入机器学习模型中。目前有研究尝试将最常用的基于文件路径相似度的推荐规则作为一个特征融入机器学习模型中,但在将规则转化为特征时,都存在特征维度过大的问题,极大增加了计算复杂度。

所以人们需要一种方便、高效的基于随机森林分类器的代码评审人推荐系统及方法来解决上述问题。

发明内容

本发明的目的在于提供一种基于随机森林分类器的代码评审人推荐系统,以解决现有技术中的问题。

为实现上述目的,本发明提供如下技术方案:

一种基于随机森林分类器的代码评审人推荐系统,包含:

输入模块,所述输入模块用于获取项目历史代码评审记录;

计算模块,所述计算模块用于根据项目历史代码评审记录,挖掘人员活跃度特征、代码变更特征和文件权重特征;

模型训练模块,所述模型训练模块用于在随机森林分类器中,以项目历史代码评审记录的评审人作为分类标签,将计算好的特征向量作为数据集,训练分类模型;

推荐结果输出模块,所述推荐结果输出模块用于从所述项目历史代码评审记录中抽取特征,输入到随机森林分类器中,输出评审概率最高的N个类别作为推荐分类,每个推荐分类对应的评审人即推荐评审人,其中N为小于等于评审人总数的任意正整数。

优选地,所述输入模块中项目历史代码评审记录是与软件项目匹配的代码提交日志和代码评审日志,所述代码提交日志包括:代码提交者、提交时间、分支、新增代码行数、删减代码行数、文件路径集合;所述代码评审日志包括:评审人、评审时间。

进一步地,所述计算模块包括人员活跃度特征计算单元、代码变更特征计算单元和文件权重特征计算单元:

所述人员活跃度特征计算单元,是根据所述项目历史代码评审记录,用于计算软件开发者在近一个月内进行代码提交的次数、参与代码评审的次数、当次代码提交时间与最近一次代码提交时间之间的时间差,组成一个向量,作为人员活跃度特征;

所述代码变更特征计算单元,根据所述项目历史代码评审记录,对代码提交日志内的分支进行编码,将分支编码与新增代码行数、删减代码行数进行结合,组成一个向量,作为代码变更特征;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010373726.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top