[发明专利]一种跨项目软件缺陷预测方法有效

专利信息
申请号: 201910721866.4 申请日: 2019-08-06
公开(公告)号: CN110442523B 公开(公告)日: 2023-08-29
发明(设计)人: 冯落落;李锐;于治楼 申请(专利权)人: 山东浪潮科学研究院有限公司
主分类号: G06F11/36 分类号: G06F11/36
代理公司: 济南信达专利事务所有限公司 37100 代理人: 冯春连
地址: 250100 山东省济*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 项目 软件 缺陷 预测 方法
【说明书】:

发明公开一种跨项目软件缺陷预测方法,涉及数据处理技术领域。针对软件缺陷预测过程经常受阻、且往往会出现类别分布不平衡的问题,采用方案基于TextCNN和Borderline‑SMOTE算法,包括训练阶段和预测阶段。在训练阶段,基于Java源文件的已知维度特征、语义信息特征、以及存在的软件缺陷,进行Word2vec模型、TextCNN、逻辑回归分类器的训练,在预测阶段,则直接利用训练好的Word2vec模型、TextCNN、逻辑回归分类器的进行目标Java源文件的预测,并最终预测输出目标Java源文件的软件缺陷数量。本发明的预测方法提高了预测的准确率和提高训练速度,不仅限于对同项目的软件缺陷进行预测,还可以用于跨项目的软件缺陷进行预测。

技术领域

本发明涉及数据处理技术领域,具体的说是一种跨项目软件缺陷预测方法。

背景技术

软件缺陷在工业界和学术界,也被称为软件故障或软件错误等。NASA对软件缺陷的定义是:软件无法完成预期指定的功能。软件缺陷在软件开发过程中不可避免产生,根据微软研究院调查发现,每个应用软件在内部测试的时候平均1000行代码会存在10到20个软件缺陷,在已经发布的软件产品中,每1000行代码会存在0.5个软件缺陷,而为了修复已经发布软件产品中的一个软件缺陷,将花费50到200倍的成本。因此,如何帮助测试人员更快更早地发现软件中的缺陷变得更加重要。

软件缺陷预测就是为了帮助测试人员进行缺陷测试,发现源代码文件中潜在的软件缺陷,从而更好分配人力、物力进行缺陷修复。软件缺陷预测分为同项目软件缺陷预测和跨项目软件缺陷预测,它们的主要区别就是训练项目与预测项目是否是同一个软件项目。由于跨项目缺陷预测中,源项目和目标项目存在很大的差异性,所以预测性能受到阻碍。

另外,在软件缺陷预测中,往往会出现类别分布不平衡问题,即不同类别的样本数量上相差很大。

基于NLP技术的快速发展,为了获得更具有泛化能力的包含语义信息的特征,解决软件缺陷预测中出现的类别分布不平衡,提出一种跨项目软件缺陷预测方法。

TextCNN,即将卷积神经网络CNN应用到文本分类任务,利用多个不同size的kernel来提取句子中的关键信息(类似于多窗口大小的ngram),从而能够更好地捕捉局部相关性。

Borderline-SMOTE算法,其计算速度明显优于SMOTE算法,其先从少数类样本中选择种子样本,然后在种子样本上采用SMOTE算法。

发明内容

本发明针对软件缺陷预测过程经常受阻、且往往会出现类别分布不平衡的问题,提供一种跨项目软件缺陷预测方法,其基于TextCNN和Borderline-SMOTE算法,进行软件缺陷数量的预测,预测结果的准确率高。

本发明的一种跨项目软件缺陷预测方法,解决上述技术问题采用的技术方案如下:

一种跨项目软件缺陷预测方法,其包括训练阶段和预测阶段;

训练阶段包括:

Ⅰ)提取Java源文件的原始多维特征,并对每一个Java源文件进行标记;

Ⅱ)将Java源文件解析成抽象语法树,抽取抽象语法树的相关节点形成单词文件;

Ⅲ)训练Word2vec模型,利用Word2vec模型对单词进行向量化,形成词向量;

Ⅳ)已知Java源文件包含的语义信息,提取Java源文件所包含语义信息的特征,基于词向量和提取的特征训练TextCNN;

Ⅴ)组合包含Java源文件语义信息的特征和Java源文件的原始多维特征,形成新特征向量;

Ⅵ)利用Borderline-SMOTE算法对组合后的新特征向量进行不平衡处理;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮科学研究院有限公司,未经山东浪潮科学研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910721866.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top