[发明专利]一种面向软件缺陷个数预测的特征选择方法有效
申请号: | 201710374939.8 | 申请日: | 2017-05-24 |
公开(公告)号: | CN107239798B | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 余啸;刘进;马子逸;崔晓晖;谷懿;井溢洋 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F11/36 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 软件 缺陷 个数 预测 特征 选择 方法 | ||
本发明针对软件缺陷数据集中不相关特征和冗余特征会降低软件缺陷个数预测模型的性能的问题,提出了一种面向软件缺陷个数预测的特征选择方法。首先利用特征与特征之间的关联性,对特征集进行谱聚类,将相互之间冗余度高的特征聚类到同一个簇中。在聚类的结果中,利用特征与软件缺陷个数之间的相关性,从每个簇中选出相关性最强的几个特征,这样既降低了特征之间的冗余度,又排除了不相关特征,得到最终的有益于缺陷个数预测模型性能的特征子集。本发明的技术方案具有简单、快速的特点,得到的特征子集有助于提高软件缺陷个数预测模型的性能。
技术领域
本发明属于特征选择领域,特别是涉及一种面向软件缺陷个数预测的特征选择方法。
背景技术
(1)软件缺陷预测技术:软件缺陷是计算机软件或程序中存在的某个破坏正常运行能力的问题、错误以及隐藏的功能缺陷。随着软件系统在工程应用中的不断扩大,软件缺陷导致的经济损失日益增加。据美国国家标准与技术所的一项研究表明,软件缺陷给美国每年造成的损失高达几百亿元,而其中超过三分之一的损失,如果提前稍加测试,即可避免。除了经济领域,还有一些软件是飞行控制系统软件和医疗设备软件,这些和人命相关的软件,一旦出现软件缺陷问题,就会给人民生命财产安全带来无端灾难,因此软件缺陷预测技术意义重大。软件缺陷预测技术是软件质量保证中的一项重要技术。软件缺陷预测通过分析软件历史仓库,建立缺陷预测模型,对新的软件模块进行缺陷预测。对预测出潜在缺陷的新的软件模块分配更多的测试资源,可以达到合理分配测试和维护资源的目的。目前为止,已有很多高效的软件缺陷方法被提出。
但这些预测通常只给出有缺陷或无缺陷的二分类结果。现有技术表明,如果只按照有无缺陷来分配有限的测试资源,可能会造成资源分配的浪费。如果我们能够准确的预测出缺陷个数,使软件测试人员主要关注那些拥有更多缺陷的软件模块,就可使软件测试工作更为有效。因此,预测软件缺陷个数相比于单纯的预测软件模块是否有缺陷更利于优化软件测试资源的分配。
软件缺陷个数预测过程分为四个阶段:(a)挖掘软件历史仓库,从中抽取出有用的程序模块。程序模块粒度可根据实际应用场景,可设置为文件、包、类或函数等。(b)提取出与软件缺陷有关的特征,并构建出软件缺陷个数训练集。(c)借助特定的建模方法在软件缺陷个数训练集上构建出软件缺陷个数预测模型。不同于单纯的预测新的软件模块是否存在缺陷时采用的是分类模型,软件缺陷个数建模方法采用的是回归模型。(d)在对新的软件模块提取出特征后,利用步骤(d)中训练出的软件缺陷个数预测模型,预测该模块存在多少个缺陷。
在构建软件缺陷预测模型时,与提取出与软件缺陷有关的特征中不可避免会产生冗余特征和不相关特征。冗余特征指的是该特征所包含的信息能从其他特征中推演出来的特征。无关特征则是对采用的机器学习算法不能提供任何的帮助。这些特征的存在会严重影响软件缺陷个数预测模型的准确率,因此,使用特征选择方法去除这类特征是十分必要的。
(2)特征选择技术:特征选择是指从原始特征中选取最小数量的特征子集,特征子集内的属性应与样本类别具有最大相关度,而属性与属性之间又具有最小相关度。之所以需要对特征进行选择,一方面是因为往往大量的原始特征会导致处理的时间和空间复杂度过高,另一方面则是大量不相关特征或冗余特征反而会降低分析方法的性能。因此,有效的特征选择对于缺陷预测技术是非常必要的。目前已有一些研究者将特征选择的方法应用到软件缺陷预测中。现有技术有针对软件度量中穷举搜索的不可行性,提出了一种混合属性选择方法,并减少了特征子集的搜索空间。还有研究构建了一种新的软件缺陷预测框架,并将基于过滤式的特征选择方法应用到了软件缺陷预测中。还有研究提出了一种混合特征选择方法,首先基于特征子集评估器移除软件缺陷数据集中的无关特征和冗余特征,随后基于特征排序评估器进一步移除其中的无关特征,实验结果表明该方法能有效提高缺陷预测模型的性能。但这些特征选择方法都只是针对预测软件模块是否有缺陷的问题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710374939.8/2.html,转载请声明来源钻瓜专利网。