[发明专利]一种软件缺陷预测特征的选择方法及装置在审
申请号: | 202011097889.1 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112269732A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 滕俊元;高猛;郑小萌;江云松;孙民;杜楠;高栋栋;李鹏宇;侯成杰;郝伟 | 申请(专利权)人: | 北京轩宇信息技术有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06N3/00 |
代理公司: | 中国航天科技专利中心 11009 | 代理人: | 陈鹏 |
地址: | 100190 北京市海淀区科学院*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 软件 缺陷 预测 特征 选择 方法 装置 | ||
1.一种软件缺陷预测特征的选择方法,其特征在于,包括:
根据历史软件缺陷数据库,获取领域缺陷数据集;
基于Bootstrap抽样技术对所述领域缺陷数据集进行抽样处理,生成软件缺陷样本集;
基于所述软件缺陷样本集和马尔科夫毯模型,对原始特征进行分组,得到多个特征组;
根据预先设计的启发式特征选择策略,从所述多个特征组中筛选出初始特征,得到筛选的候选特征序列;
基于遗传算法从所述候选特征序列中搜索出目标特征子集。
2.根据权利要求1所述的方法,其特征在于,所述基于软件缺陷样本集和马尔科夫毯模型,对原始特征进行分组,得到多个特征组,包括:
计算所述软件缺陷样本集中特征与特征之间的对称不确定性SU1值,及所述软件缺陷样本集中特征与目标类别之间的对称不确定性SU2值;所述目标类别包括:缺陷类别和非缺陷类别;
根据所述对称不确定性SU1值、所述对称不确定性SU2值和所述马尔科夫毯模型,对所述原始特征进行分组,得到所述多个特征组。
3.根据权利要求1所述的方法,其特征在于,所述根据预先设计的启发式特征选择策略,从所述多个特征组中筛选出初始特征,得到筛选的候选特征序列,包括:
获取所述多个特征组中类相关度最大的第一特征;
获取所述多个特征组中Fisher得分最高的第二特征;
获取所述多个特征组内特征相关度累加和最大的第三特征;
获取所述多个特征组间特征相关度累加和最小的第四特征;
基于所述第一特征、所述第二特征、所述第三特征和所述第四特征,生成所述候选特征序列。
4.根据权利要求3所述的方法,其特征在于,所述获取所述多个特征组中类相关度最大的第一特征,包括:
针对每个所述特征组,计算所述特征组内每个特征与目标类别之间的对称不确定性值;
选取所述对称不确定性值最大的特征作为所述第一特征。
5.根据权利要求3所述的方法,其特征在于,所述获取所述多个特征组中Fisher得分最高的第二特征,包括:
针对每个所述特征组,计算所述特征组内每个特征的Fisher评分值;
选取所述特征组内的所述Fisher评分值最高的特征作为所述第二特征。
6.根据权利要求3所述的方法,其特征在于,所述获取所述多个特征组内特征相关度累加和最大的第三特征,包括:
针对每个所述特征组,计算所述特征组内的一个特征与其它所有特征之前的对称不确定性值的和值;
将所述和值最大的特征作为所述第三特征。
7.根据权利要求3所述的方法,其特征在于,所述获取所述多个特征组间特征相关度累加和最小的第四特征,包括:
针对每个所述特征组,计算所述特征组内的每个特征与其它特征组内的所有特征的对称不确定性值的和值;
将所述特征组内的对称不确定性值的和值最大的特征作为所述第四特征。
8.根据权利要求1所述的方法,其特征在于,所述基于遗传算法从所述候选特征序列中搜索出目标特征子集,包括:
计算所述候选特征序列中每个特征出现的特征概率;
根据所述特征概率,生成由M个个体组成的初始种群;其中,M为正整数;
根据所述领域缺陷数据集、所述初始种群和适应度函数,计算所述M个个体对应的适应度;
根据所述适应度从所述候选特征序列中筛选出所述目标特征子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京轩宇信息技术有限公司,未经北京轩宇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011097889.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防震的新能源汽车电池固定装置
- 下一篇:一种新型腹腔置管引流组件