[发明专利]一种基于迁移性分析的跨项目缺陷预测方法有效

专利信息
申请号: 201910524720.0 申请日: 2019-06-18
公开(公告)号: CN110175726B 公开(公告)日: 2021-03-26
发明(设计)人: 余跃;张迅晖;毛新军;曾雅蓉;王涛;李志星;范强 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06F17/18;G06F11/36
代理公司: 长沙国科天河知识产权代理有限公司 43225 代理人: 邱轶
地址: 410073 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 迁移性 分析 项目 缺陷 预测 方法
【说明书】:

发明公开了一种基于迁移性分析的跨项目缺陷预测方法,针对开源社区中跨项目缺陷预测模型的迁移需求,考虑项目之间的相关性,利用开源社区中包括提交代码、提交关联文本信息、提交相关历史信息等在内的各种维度的信息,分析项目间缺陷预测模型的可迁移性,进而形成缺陷预测方法。该方法的提出,辅助代码审查,促进开源项目快速健康发展。

技术领域

本发明设计一种基于迁移性分析的跨项目缺陷预测方法,主要包含项目间不同维度的关联因素对跨项目缺陷预测效果的影响分析,以及基于分析结果和集成投票方法形成的跨项目缺陷预测方法。

背景技术

自2010年pull request技术提出以来,Github社区在7年时间累积产生了超过3千万的pull request,并且仍在以迅猛的速度增长。然而,由于提交pull request的项目开发人员编程经验不足、开发过程不合理、需求理解不正确,导致其提交的pull request会引入各种各样的软件缺陷,进而对软件质量和软件的健康发展产生影响。开源社区采用轻量级的过程管理工具以来,大大降低了外围贡献者参与项目贡献门槛,但同时增加了开源项目过程制品维护的难度,以完全人工的方式去查看新增代码是否会引入新缺陷,既耗时又费力。因此,引入自动化缺陷预测方法,可以辅助缺陷发现,减轻审查者工作量,进而加速软件健康稳定的发展。然而传统的基于有监督学习的机器学习缺陷预测方法依赖于足够可利用的训练样本,以总结出经验知识来对未来数据做决策,这对于没有足够历史数据积累的新兴开源项目来说是不友好的,因此我们考虑通过跨项目缺陷预测模型的迁移解决该问题,帮助新兴项目渡过冷启动阶段。

跨项目缺陷预测模型迁移性分析,需要考虑项目之间的相关性,利用开源社区中包括提交代码、提交关联文本信息、提交相关历史信息等在内的各种维度的信息,分析项目间缺陷预测模型的可迁移性,进而形成缺陷预测方法。

发明内容

本发明的目的在于针对开源社区中跨项目缺陷预测模型的迁移需求,提出一种基于迁移性分析的跨项目缺陷预测方法,全面分析了该情况下影响模型迁移性的各种因素,利用集成投票的方式进行跨项目缺陷预测,具有较高的准确率。

为实现上述技术目的,本发明的技术方案如下:

一种基于迁移性分析的跨项目缺陷预测方法,包括以下步骤:

S1.根据开源社区中开源项目包含的pull request数量及开源语言种类,选取开源社区中开源项目作为迁移分析的项目集合,进行数据采集;

其中数据采集内容包括:项目源代码、历史代码提交信息、代码提交更改信息、代码提交历史轨迹、代码提交更改的文件、代码提交更改的文件对应的历史开发人员数量、代码提交更改文件的平均时间间隔以及缺陷信息;其中缺陷信息包括缺陷报告、缺陷报告标记位和缺陷报告对应的编号,pull request、ReadMe文件;

S2.提取迁移分析项目集合中的每个开源项目对应的历史代码提交信息和缺陷信息,将S1中采集到的数据分为引入缺陷的代码提交和未引入缺陷的代码提交;

S3.将S2中得到的引入缺陷的代码提交分别提取在扩散维度、代码维度、代码更改目的维度、文本信息维度和历史维度下代码提交可能引入缺陷的项目内度量因素,得到代码提交可能引入缺陷的项目内多维度量因素;

S4.利用S2中得到的引入缺陷的代码提交以及S3中提取的可能引入缺陷的项目内多维度量因素,利用随机森林方法训练迁移分析项目集合中每个项目的项目内缺陷预测模型;

S5.统计迁移分析项目集合中不同项目间,在项目维度、技术维度和人员维度下影响项目间缺陷预测的项目间关联关系多维度量因素;

S6.根据S4中得到的迁移分析项目集合中每个项目的项目内缺陷预测模型,计算迁移分析项目集合中每个项目的项目内缺陷预测模型对其他项目缺陷预测的准确率,得到项目间缺陷预测准确率;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910524720.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top