[发明专利]一种基于Active Learning的项目内软件老化缺陷预测方法有效
申请号: | 202011511241.4 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112527670B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 向剑文;梁梦婷;李滴萌;赵冬冬;胡文华;李琳 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62;G06N20/10 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 张惠玲 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 active learning 项目 软件 老化 缺陷 预测 方法 | ||
本发明公开了一种基于Active Learning的项目内软件老化预测方法,通过收集软件中代码静态度量,使用Active Learning挑选出样本进行打标签作为训练集,去预测剩下的无类标的样本。采用Active Learning进行样本挑选和人工打标签,构成训练集。采用过采样和欠采样结合法缓解类不平衡问题,使用机器学习分类器进行预测。本发明考虑了软件老化缺陷数据集样本少,收集比较耗时耗力,采用欠采样和过采样结合的方法缓解极类不平衡问题,有助于开发者在开发测试阶段发现软件老化相关缺陷并移除,避免软件老化问题带来的损失。本发明已在真实软件上验证过其可行性,并可推广至其他软件来预测软件老化相关缺陷。
技术领域
本发明属于软件老化预测技术领域,具体涉及一种基于Active Learning的项目内软件老化缺陷预测方法。
背景技术
在长期运行的操作系统中,软件老化是造成系统性能下降或软件崩溃的主要原因。其由软件老化相关缺陷(Aging-Related Bugs,ARB)引起,如内存泄漏,未释放的文件锁,存储问题等。且其已被发现存在于多种系统中,如Android、Linux、Windows等。软件老化的复杂性和时间特性导致其检测十分困难。故在开发测试阶段(代码层次)预测并移除软件老化相关缺陷是降低软件老化所带来损失的重要方式之一。
近年来,老化缺陷预测逐步受到可靠性领域学者的重视。部分学者通过使用代码静态特征(如代码行数,注释数等)并利用机器学习等方法来训练模型进行项目内老化缺陷预测,然而由于老化缺陷占比较少,如Linux老化缺陷数据集中老化缺陷仅占比0.59%,对我们来说在项目内收集到足够的训练数据进行建模是非常困难的。
针对软件老化训练数据不充足这个问题,有学者提出了跨项目的软件老化缺陷预测,主要方法是通过迁移学习来减少分布差异,并进一步处理类不平衡问题来进行跨项目老化缺陷预测。这种方式虽然数据量充足,但是不同项目之间的差异还是比较严重,所以,跨项目的预测性能和项目内的预测性能还是存在一定差异的。而且,先前的研究中,处理极其严重的类不平衡时,使用的是过采样或欠采样单个方式,极易导致过拟合,对不同的机器学习分类器不够健壮,即预测效果差异较大。
发明内容
为了克服上述背景技术的缺陷,本发明提供一种基于Active Learning的项目内软件老化缺陷预测方法。
为了解决上述技术问题本发明的所采用的技术方案为:
一种基于Active Learning的项目内软件老化缺陷预测方法,包括:
步骤1,对一个项目内无类标的样本,运用Active Learning选取其中具有代表性的和信息量丰富的第一类样本;
步骤2,针对选取的第一类分样本,再加上已有的有类标的样本组成训练集;
步骤3,针对训练集,采用过采样方法SMOTE和欠采样方法ENN联合进行类不平衡问题处理,学习分类特征;
步骤4,针对步骤3处理后的数据,采用机器学习方法训练预测模型并在测试集上进行老化缺陷预测。
较佳的,在运用Active Learning选取其中具有代表性的和信息量丰富的第一类样本的步骤中,使用Active Learning领域提出的Active Learning by QueryingInformative and Representative Examples(QUIRE)方法,根据有类标的样本训练出来的的分类器对要选取的样本的不确定性来选取信息量大的样本,根据未标记的样本训练出来的分类器对要选取样本的不确定性来选择具有代表性的样本。
较佳地,步骤2中采用选取出来的样本加上已有的有类标的样本组成训练集的步骤中,训练集包含整个项目的初始已标记样本和Active Learning挑选出来的有具有代表性的样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011511241.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:上料工装
- 下一篇:授信处理方法、装置、设备及系统