[发明专利]基于代价敏感半监督的软件缺陷预测方法有效

专利信息
申请号: 201610513167.7 申请日: 2016-06-30
公开(公告)号: CN106201871B 公开(公告)日: 2018-10-02
发明(设计)人: 徐玲;廖胜平;洪明坚;葛永新;杨梦宁;张小洪;杨丹;王洪星;黄晟;周末 申请(专利权)人: 重庆大学
主分类号: G06F11/36 分类号: G06F11/36
代理公司: 重庆信航知识产权代理有限公司 50218 代理人: 穆祥维
地址: 400044 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及基于代价敏感半监督的软件缺陷预测方法,包括如下步骤,S1通过版本控制工具收集待预测软件的源代码文件;S2所述S1得到的源代码文件由I个模块组成,从所述源代码文件中提取度量元值;S3通过采样的方式通过度量元值选取模块得到采样结果集;S4标注后采样结果集和无标记样本集构建训练集;S5提出目标函数,求解使目标函数值最小的分类函数,S6通过分类函数对待预测集中的模块进行预测,并输出预测结果。该方法融合半监督和代价敏感思想构建软件缺陷预测模型,解决了软件缺陷预测中缺陷数据难以获取和类不平衡两个问题,极大提高了预测结果的准确性。
搜索关键词: 基于 代价 敏感 监督 软件 缺陷 预测 方法
【主权项】:
1.基于代价敏感半监督的软件缺陷预测方法,其特征在于,包括如下步骤:S1:通过版本控制工具收集待预测软件的源代码文件;S2:所述S1得到的源代码文件由I个模块组成,从所述源代码文件中提取度量元值,所有度量元值构成一个集合X,X={x1,1,x2,2,...xi,j,...xI,J}  (1);xij表示第j个度量元在第i个模块上的度量元值,I表示待预测软件中源代码文件的总数,J表示提取的度量元的总数;每个模块对应一个度量元向量,定义xi表示第i个模块的度量元向量,xi={xij|j=1,2,3...J};S3:采样;S3a:Mj表示所有模块上的度量元值的中位数,确定满足xij>Mj,i=1,2,...I,j=1,2,...J的个数;I)令i=1;II)令j=1;III)令Ki=0;IV)如果xij>Mj,则Ki=Ki+1,并令j=j+1,执行下一步;否则,令j=j+1,并执行下一步;V)如果j≤J,则返回Ⅳ);否则令i=i+1,并执行下一步;VI)如果i≤I,则返回Ⅱ);否则执行下一步;VII)输出Ki;S3b:Ki值对应第i个模块,i=1,2…I,根据Ki值从大到小的顺序对Ki值对应的模块进行排序;S3c:选取S3b排序后,处于前N位置的N个模块构成候选集,再从候选集中随机选取n个模块构成采样结果集,N>n;S4:构建训练集;S4a:对S3c得到的采样结果集中的n个模块,根据其是否存在缺陷给其打上有缺陷模块的分类标签或无缺陷模块的分类标签,分类标签y∈{±1},打上分类标签y=1的模块表示为有缺陷模块,打上分类标签y=‑1的模块表示为无缺陷模块;标记后的采样结果集为有标签样本集,记为τn={(x1,y1),…(xi,yi)…,(xn,yn)},其中,xi表示第i个模块的度量元向量,yi表示第i个模块的标签;S4b:从I个模块中踢出采样结果集中的n个模块,然后再随机选取u个模块,所述u个模块构成无标记样本集,记为τu={(x1,y1),…(xi,yi)…,(xu,yu)},其中,yi=0,i=1,2,...u;S4c:S4a得到的有标签样本集和S4b得到的无标记样本集构成训练样本集;S5:构建预测模型;S5a:提出目标函数如下:其中,H是由核函数k生成的再生核希尔伯特空间,l(yi,f(xi))和是加权损失函数,分别见公式(3)和(4),C1和C2是正则化参数,为经验值,表示训练过程中的预测标签;r是设定的参数,为经验值,其中,1是全1向量,yi表示真实标签;其中,C(‑1)是错分非缺陷模块的代价,是经验值,C(+1)是错分缺陷模块的代价,为经验值;S5b:求解目标函数,得到使目标函数值最小的分类函数f(xi);S6:从I个模块中踢出训练样本集中的模块后剩余的模块构成待预测集,将待预测集中一个模块的度量元向量输入分类函数f(xi),如果得到值小于0,则该模块被预测为无缺陷,如果得到的值大于0,则该模块被预测为有缺陷;按照上述方式,将预测集中每个模块对应的度量元向量输入所述分类函数,对预测集中的每个模块进行预测,并输出预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610513167.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top