[发明专利]基于贝叶斯模型和粒子群优化的软件缺陷预测方法有效
申请号: | 202110772750.0 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113268434B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 邢颖;林雪燕;林婉婷 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62;G06N3/00;G06N7/00;G06Q10/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 贝叶斯 模型 粒子 优化 软件 缺陷 预测 方法 | ||
本发明提供一种基于贝叶斯模型和粒子群优化的软件缺陷预测方法。软件缺陷预测方法包括:输入源项目数据集;对源项目数据集的每一维特征计算平均值;根据平均值将源项目数据集中的样本划分为大于和小于平均值两部分;使用一阶依赖的贝叶斯模型分别在两部分数据上进行训练;将训练得到的两个子模型共同构建成一个基分类器;将所有基分类器组成初始种群;使用基于Pareto熵的多目标粒子群优化方法对初始种群进行迭代;得到最优组合权重得基分类器组合;输入目标项目数据集;利用基分类器组合在目标项目数据集上进行分类;输出分类的结果。本发明提供的软件缺陷的预测方法,速度快,准确率高。
技术领域
本发明属于软件测试技术领域,尤其是涉及一种基于贝叶斯模型和粒子群优化的软件缺陷预测方法。
背景技术
跨项目软件缺陷预测具有广泛的实用价值,但通常相较于项目内缺陷预测其性能会更弱,主要原因是源项目和目标项目中的特征存在差异,分布不一致,对于分类器。同时,跨项目的缺陷预测有软件缺陷预测的通病:在数据集中,有缺陷的模块数量远小于没有缺陷的模块数量,即类不平衡问题,而模型在进行预测时,往往会偏向数量更多的一方,从而降低了对有缺陷模块的判断精度。
现有的跨项目软件缺陷的预测方法,由于上述的影响因素,准确率,可靠性较低,难以满足对跨项目软件缺陷的预测结果的需求。
发明内容
本发明提供了一种基于贝叶斯模型和粒子群优化的软件缺陷预测方法,用以克服现有技术中源项目和目标项目特征分布差异性和类不平衡数据对预测结果有较大负面影响的问题。
本发明提供了一种基于贝叶斯模型和粒子群优化的软件缺陷预测方法,包括:
输入源项目数据集;
计算每一维特征的平均值;
对源目标数据集的每一维特征进行平均值的计算;
根据每一维特征平均值将训练集分为大于均值和小于均值的两部分数据;
使用平均一阶依赖贝叶斯模型分别在两部分数据上进行训练;
将训练得到的两个子模型共同构建一个基分类器;
将上述构造的多个基分类器组成初始种群;
将初始种群输入到基于Pareto熵的多目标粒子群优化方法中;
得到最优组合权重得基分类器组合;
输入目标项目数据集;
利用基分类器组合在目标项目数据集上进行分类;
输出分类的结果。
附图说明
图1为本发明提供的基于贝叶斯模型和粒子群优化的软件缺陷预测方法实施实例的流程示意图。
具体实施方式
图1为本发明提供的一种基于贝叶斯模型和粒子群优化的软件缺陷预测方法实施实例的流程示意图。如图1所示,该跨项目软件缺陷的预测方法包括:
S200,输入源项目数据集。
在本说明中,源项目数据集的类标被认为是存在的,故使用标注好的源项目数据作为训练集进行训练。
S201,计算每一维特征的平均值。
在源项目数据集中,源项目存在多维特征空间,在此步骤对每一维特征进行一次平均值计算,目的是为了在后续步骤中对样本进行分类。
S202,取当前样本的第一维特征。
本发明在第一轮循环中取第一个样本作为当前样本,在当前样本的第一轮循环中取第一个特征作为当前特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110772750.0/2.html,转载请声明来源钻瓜专利网。