[发明专利]开源软件开发中Issue解决时间的预测方法及系统有效
申请号: | 202010032795.X | 申请日: | 2020-01-13 |
公开(公告)号: | CN111258624B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 曹健;王逸然;钱诗友 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F8/70 | 分类号: | G06F8/70;G06F18/2431;G06F18/214 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 软件 开发 issue 解决 时间 预测 方法 系统 | ||
1.一种开源软件开发中Issue解决时间的预测方法,其特征在于,包括:
步骤1:爬取开源软件平台上的不同项目中的Issue数据组;
步骤2:清洗整理原始数据并制作事件日志;
步骤3:挖掘Issue解决过程的两阶段中的频繁模式;
步骤4:利用Issue动态和静态特征构建Issue解决模式动态预测模型,基于模式信息构建动态Issue解决时间预测模型;
步骤5:获取开源软件开发中Issue解决时间的预测结果信息;
所述步骤4包括:
步骤4.1:从源数据中挖掘与Issue两阶段模式相关的静态特征,按日历习惯在不同的时间戳上挖掘与两阶段模式相关的动态特征;所挖掘出的特征可以分为Issue特征、Issue创建者特征和项目特征3类;
步骤4.2:以在不同的时间戳上应用不同的机器学习方法训练不同的模型;
步骤4.3:应用微平均F1-score和宏平均F1-score对不同的分类器性能进行评估和比较;
步骤4.4:从源数据中挖掘与Issue解决时间相关的静态特征,按日历习惯在不同的时间戳上挖掘与两阶段模式相关的动态特征,同时加入Issue解决模式动态预测模型所预测的各模式的概率信息;
步骤4.5:在不同的时间戳上应用不同的机器学习方法训练不同的模型;
步骤4.6:应用微平均F1-score和宏平均F1-score对不同的分类器性能进行评估和比较;
所述利用Issue动态和静态特征构建Issue解决模式动态预测模型包括特征选择、模型训练和模型评估;
所述基于模式信息构建动态Issue解决时间预测模型包括:特征选择、模型训练和模型评估。
2.根据权利要求1所述的开源软件开发中Issue解决时间的预测方法,其特征在于,所述步骤1包括:
步骤1.1:通过开源软件平台上Issue的标记进行筛选,爬取Issue的基本信息、回复信息、事件信息以及作者信息;
所述爬取开源软件平台上的不同项目中的Issue数据组包括:爬取故障维修类型的Issue。
3.根据权利要求1所述的开源软件开发中Issue解决时间的预测方法,其特征在于,步骤2包括:
步骤2.2:以爬取的Issue事件信息为基础,加上开始和结束事件,依据开源平台的规则合并事件,最后以Issue的Id、事件名称以及事件发生的时间组合成一条记录,并由所组合的记录集合成事件日志。
4.根据权利要求1所述的开源软件开发中Issue解决时间的预测方法,其特征在于,所述步骤3包括:
步骤3.1:将所制作出的事件日志作为输入文件,应用过程挖掘技术得到分析结果,根据Issue解决路径将Issue解决过程分为两个阶段,并在两阶段中应用过程挖掘技术分别挖掘频繁模式;共挖掘出第一阶段4种模式,第二阶段5种模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010032795.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电致发光器件
- 下一篇:一种基于同步平均主成分时频分析的确定性信号提取方法