[发明专利]一种组合式软件缺陷报告分类方法有效
申请号: | 201410250512.3 | 申请日: | 2014-06-09 |
公开(公告)号: | CN104021180B | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 周宇;童燕翔;古睿航 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F9/44 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙)32249 | 代理人: | 贾郡 |
地址: | 210016*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 组合式 软件 缺陷 报告 分类 方法 | ||
技术领域
本发明涉及一种软件缺陷报告分类方法,属于计算机软件开发领域。
背景技术
软件缺陷是衡量软件质量的重要指标,缺陷的及时修复对提高用户满意度相当重要。为了有效的管理软件缺陷,通常使用缺陷跟踪系统(BTS)来管理软件缺陷以及需求。当一个软件发布以后,相应的BTS就负责收集程序测试人员或者终端用户提交的对软件缺陷的描述报告,软件的开发人员可以通过这些报告对软件进行适当的维护和完善。
软件开发人员最需要维护的是修正性缺陷(bug),这些缺陷涉及到代码的修改,对系统的运行至关重要。相对而言,那些对系统功能的期望,即提高型或者完善型的缺陷(non-bug)可缓一步进行或者可不需维护。然而,提交缺陷报告人员的软件知识水平参差不齐,大多数非软件行业的终端用户对于任何使用过程中出现的不尽如人意的地方都会认为是修正性缺陷,这就向BTS里添加了很多维护的噪声,同时也为基于软件缺陷报告的科学研究引入了偏差。
过去的缺陷预测重点在于模型的建立,通过改良模型不断的提高预测的精确度,却忽视了数据源本身的优良。缺陷预测所使用的大多数的数据库都是由BTS等提供源数据。由上述可知,数据库里存在可观的噪声。众所周知,软件缺陷预测的关键就是训练集和测试集,数据库里的噪声必然引入误差。为了减少误差,数据源的降噪处理变得尤为重要。
近年,缺陷预测开始涉及到对数据的处理上。目前通过人工标记和监督式学习,已经可以高效的预测缺陷报告是否为修正型缺陷。一般地,软件缺陷报告的特征属性分为结构型属性,如编号ID、优先级(priority)、严重性(severity)等和非结构型或者是半结构型属性,如小结(summary)、描述(div)、讨论(discussion)。一般对于它的预测要么是基于结构型的属性,利用机器学习的方法进行预测;要么是基于非结构型属性,利用文本挖掘的技术进行预测;或者是将结构性的属性与非结构型的属性处理成文本信息,在进行文本挖掘。
发明内容
本发明的目的在于提供一个组合式缺陷报告分类方法,通过滤除非修正性缺陷报告,达到降低缺陷数据库的噪声、提高缺陷预测研究精确度的目的。
为了达到上述目的,本发明组合式软件缺陷报告分类方法包括以下步骤:
1)提取该软件缺陷报告的非结构型特征属性,并进行预处理而得到特征词集合;
2)利用监督式的文本挖掘技术预测所述特征词集合所描述的内容倾向于修正性缺陷报告的程度等级;
3)将所述程度等级的预测结果与该软件缺陷报告的编号与有用的结构型特征属性相结合,生成一新的软件缺陷报告;
4)利用数据挖掘的方法预测新的软件缺陷报告是否为修正性缺陷报告。
进一步的,步骤1)中仅提取非结构型特征属性的小结。
进一步的,对所述小结进行分词、去停用词和提取词干的处理,且停用词根据文本特性自由添加。
进一步的,利用贝叶斯多项式预测非结构型属性偏向于修正性缺陷的程度等级,并使用十倍交叉验证。而且,在所述十倍交叉验证中,每次迭代都有九份数据是人工标引的实例,且所述人工标引的实例由相应特征词集合和对应的程度等级标引组成。
进一步的,所述非结构型属性的十倍交叉验证的十份数据由编写的代码完成分割,从而便于对对应的软件缺陷报告编号ID进行追踪。
进一步的,在步骤4)中利用贝叶斯网络对缺陷报告进行预测,并使用十倍交叉验证,且所述十倍交叉由机器学习工具完成。且在该十倍交叉验证中,每次迭代都有九份数据是人工标引的实例,且所述人工标引的实例是由相应新的软件缺陷报告的有用的结构型特征属性以及新的缺陷报告是否为修正性缺陷的分类组成。
由上可知,本发明通过分析软件缺陷报告来判断缺陷的类型是否为修正性缺陷,通过滤除非修正性的缺陷,降低缺陷数据库的噪声,从而提高基于缺陷报告数据库的缺陷预测研究的精确度。
附图说明
图1是本发明组合式软件缺陷报告分类方法的流程图;
图2是图1实施例的数据嫁接算法的伪代码实现;
图3是图1实施例中合成新软件缺陷报告的示意图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
以下将结合附图1,对本发明的技术方案进行详细说明。
1、第一阶段
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410250512.3/2.html,转载请声明来源钻瓜专利网。