[发明专利]一种基于多特征缺陷再分配图分配缺陷报告的方法有效
申请号: | 201210057825.8 | 申请日: | 2012-03-07 |
公开(公告)号: | CN102629230A | 公开(公告)日: | 2012-08-08 |
发明(设计)人: | 张卫丰;张静;张迎周;周国强;周国富;王慕妮;许碧欢;陆柳敏;顾赛赛 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 叶连生 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于多特征缺陷再分配图分配缺陷报告的方法综合运用机器学习模型和缺陷再分配图预测缺陷修复人员,用已修复的缺陷报告中开发人员之间的再分配关系,将再分配关系转化为缺陷再分配图,使用机器学习模型预测完缺陷报告开发人员后,结合缺陷再分配图更新缺陷报告开发人员,完成缺陷报告修复人员的预测;具体方法为以下步骤:步骤1)对选取的缺陷报告数据集进行分类,分为训练集和测试集;步骤2)用训练集来训练机器学习模型和创建缺陷再分配图;步骤3)用机器学习模型预测测试集的缺陷修复人员;步骤4)结合缺陷再分配图更新缺陷修复人员;通过使用本发明的方法,能有效地减少缺陷再分配的路径长度,提高缺陷分配的预测精度,降低缺陷修复人员搜索的失败率。 | ||
搜索关键词: | 一种 基于 特征 缺陷 再分 分配 报告 方法 | ||
【主权项】:
1.一种基于多特征缺陷再分配图分配缺陷报告的方法,其特征在于该方法主要分为以下步骤:一.训练阶段:获取数据集中标记为已修复的缺陷报告,训练机器学习模型和建立缺陷再分配图;步骤1)读入取缺陷报告,选取标记为已修复的缺陷报告;步骤2)将步骤1)得到的缺陷报告按时间排序,平均分成十份,九份用于训练机器学习模型,一份用于测试集;步骤3)逐一读取训练集中的缺陷报告,获取修复缺陷报告的开发人员之间的再分配路径关系,即A→B→C→D;其中A表示修复缺陷报告的第一个开发人员,A不能修复该缺陷报告,则将缺陷报告再分配给开发人员B,B也不能修复,将缺陷报告再分配给开发人员C,C再分配给开发人员D,缺陷报告最终由开发人员D修复;步骤4)将由步骤3)得到的再分配关系转化面向目标的路径图,即A→D,B→D,C→D,用公式(1)计算各个开发人员之间的状态转移概率,绘制缺陷再分配图;其中,m表示由开发人员D再分配给开发人员Dj的缺陷数目,n表示由开发人员D再分配的所有缺陷数目,D→Di表示由开发人员D分配给开发人员Di,开发人员Di不一定完成缺陷报告的修复,D→Dj表示缺陷报告由开发人员D再分配给开发人员Dj,且Dj将缺陷报告修复;步骤5)读取测试集中的第一条缺陷报告,记为bnew,提取该缺陷报告“题目”和“描述”信息;步骤6)读取训练集中的第一条缺陷报告,记为b,并提取“题目”和“描述”信息,用公式(2),计算缺陷报告的相似度,记为S;Similarity ( q 1 , q 2 ) = Σ i = 1 n w 1 i w 2 i Σ i = 1 n w 2 1 i × Σ i = 1 n w 2 2 i - - - ( 2 ) ]]> 其中,将缺陷报告的“题目”和“描述”转化为n维向量,记为(w1,w2,...,wn),w是缺陷报告中的单词,n表示缺陷报告中单词的数目,wi表示第i个单词在向量中的权重,w1i表示第1个缺陷报告中第i个单词的权重,w2i表示第2个缺陷报告中第i个单词的权重;q1=(w11,w12,...,w1n)表示选取的测试集的缺陷报告,q2=(w21,w22,...,w2n)表示选取的训练集的缺陷报告;步骤7)由步骤6)得到相似度S后,和预先给定的相似度阈值T比较,如果S≥T,则将选取的测试集中的缺陷报告bnew加入缺陷报告集合L中;步骤8)重复步骤6)和步骤7)直至计算完训练集中所有的缺陷报告;步骤9)读取集合L中的第一条缺陷报告,将修复该缺陷报告的开发人员提取出来,加入节点集合;步骤10)重复步骤9)直至提取完集合L中的所有缺陷报告,用节点集合中的开发人员,创建缺陷再分配子图;二.训练阶段,结合机器学习模型和缺陷再分配子图,预测缺陷报告的开发人员步骤11)使用数据挖掘工具来将步骤2)中得到的文本文件进行格式转换,转换结果是将所有缺陷报告的内容都写入一个.arff格式的文件中;步骤12)读取测试集中缺陷报告,提取该缺陷报告所属的产品和部件信息;步骤13)用朴素贝叶斯分类器预测修复该缺陷报告的预测开发人员列表,选择排名前五的开发人员记为{D1,D2,D3,D4,D5};步骤14)结合由步骤10)得到的缺陷再分配子图,用公式(3)更新开发人员列表;Rank(Tk)=Pr(Di→Tk)+Matched Product(Tk)+MatchedComponent(Tk)+LastActivity(Tk)(3)Pr(Di→Tk)表示开发人员Di和开发人员Tk之间的再分配转移概率,Matched Product(Tk)判定开发人员Tk修复的缺陷报告所属的产品类型,如果修复预测的缺陷报告和Tk修复的缺陷产品一样,则Matched Product(Tk)取值1,否则取值为0;MatchedComponent(Tk)判定开发人员Tk修复的缺陷报告所属的部件类型和缺陷报告部件类型是否一致,一样取值1,否则0;如果开发人员Tk最后参与缺陷修复时间在100天之内,则LastActivity(Tk)取值1,否则为0;步骤15)由步骤14)可得到新的缺陷修复人员列表{D1,T1,D2,T2,D3,T3,D4,T4,D5,T5},选取排名前五的开发人员即{D1,T1,D2,T2,D3};步骤16)重复步骤12)到步骤15)直至完成所有测试集中缺陷报告的预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210057825.8/,转载请声明来源钻瓜专利网。
- 上一篇:有机-无机杂化蛋白质分子印迹毛细管整体柱
- 下一篇:电压调节器