[发明专利]基于P-K的软件缺陷预测方法、装置、电子设备及介质在审
申请号: | 202011077409.5 | 申请日: | 2020-10-10 |
公开(公告)号: | CN114428720A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 王婷婷 | 申请(专利权)人: | 中国石油化工股份有限公司;中国石油化工股份有限公司石油物探技术研究院 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62 |
代理公司: | 北京思创毕升专利事务所 11218 | 代理人: | 孙向民;廉莉莉 |
地址: | 100027 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 软件 缺陷 预测 方法 装置 电子设备 介质 | ||
本申请公开了一种基于P‑K的软件缺陷预测方法、装置、电子设备及介质。该方法可以包括:收集软件历史缺陷数据,将软件历史缺陷数据划分为训练数据集与测试数据集;针对训练数据集内的度量元进行降维,获得特征向量;根据降维后的训练数据集与特征向量,进行KNN分类训练;调整降维参数与KNN参数,获得最优模型;根据最优模型,针对测试数据集内的度量元进行降维,并进行KNN分类训练,预测测试数据集的缺陷。本发明解决了度量元的维数问题,较好的解决软件缺陷预测的准确度,为软件缺陷预测提供可行方法,能够对软件系统做出缺陷数目预测,为制定软件测试计划提供参考指标,更好的规划人力和时间。
技术领域
本发明涉及软件测试及数据挖掘领域,更具体地,涉及一种基于P-K的软件缺陷预测方法、装置、电子设备及介质。
背景技术
从1970年开始,软件缺陷预测技术开始发展;随着软件系统规模变得越来越大,逻辑日趋复杂,软件缺陷也势必增加,影响软件质量,由于软件缺陷预测帮助测试人员了解软件的状态和质量,帮助制定交付标准,所以软件缺陷的预测也变得重要起来。
目前,软件缺陷预测分为静态和动态两种预测方法。随着软件迭代更新次数以及同类软件的增多,基于软件历史开发数据及发现的缺陷数,进行缺陷数目、类型、分布的预测成为一种切实可行方法。研究指出影响缺陷预测有3个因素,度量元的选取、缺陷预测模型的构建方法和数据集。也就是根据缺陷相关的度量元数据(代码行数、类数、方法数等),选择适当预测模型,选择适当的数据集可以有效的提高缺陷预测的转去额度。本文就基于以上静态缺陷预测方法展开研究。
怎么样从大量的开发历史数据中找到与缺陷相关的数据,也就是度量元选取问题变成首要问题,这就涉及到数据挖掘领域。现在主要运用的是PCA,LDA,LLE以及ICA等方法。其中PCA(Principle Component Analysis),主成分分析法,常用于提取数据的主要特征分量,用来对高维数据进行降维,提高运算效率。
对于静态软件缺陷预测技术,有分类、回归和基于神经网络的贝叶斯、CNN、DNN等方法,这就涉及预测模型选取问题。由于基于复杂神经网络训练模型的时间会较长,对机器性能要求较高,所以本文暂不探索研究。KNN(k-NearestNeighbor),k最近邻是监督型分类器,对有标记的数据进行训练得到模型,根据此模型对新的数据进行预测,得到标签(label)。
因此,有必要开发一种基于PCA-KNN的软件缺陷预测方法、装置、电子设备及介质。
公开于本发明背景技术部分的信息仅仅旨在加深对本发明的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
本发明提出了一种基于P-K的软件缺陷预测方法、装置、电子设备及介质,其能够解决了度量元的维数问题,较好的解决软件缺陷预测的准确度,为软件缺陷预测提供可行方法,能够对软件系统做出缺陷数目预测,为制定软件测试计划提供参考指标,更好的规划人力和时间。
第一方面,本公开实施例提供了一种基于P-K的软件缺陷预测方法,包括:
收集软件历史缺陷数据,将所述软件历史缺陷数据划分为训练数据集与测试数据集;
针对所述训练数据集内的度量元进行降维,获得特征向量;
根据降维后的训练数据集与所述特征向量,进行KNN分类训练;
调整降维参数与KNN参数,获得最优模型;
根据所述最优模型,针对所述测试数据集内的度量元进行降维,并进行KNN分类训练,预测所述测试数据集的缺陷。
优选地,针对所述训练数据集内的度量元进行降维,获得特征向量包括:
通过PCA主成分分析技术,将高维数据进行特征选择,去冗余,获得前k个特征值对应的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油化工股份有限公司;中国石油化工股份有限公司石油物探技术研究院,未经中国石油化工股份有限公司;中国石油化工股份有限公司石油物探技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011077409.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽油组分生产碳八芳烃的方法
- 下一篇:一种汽油升级方法