[发明专利]一种基于聚类分析和决策树算法的软件缺陷预测方法在审

专利信息
申请号: 202111382959.2 申请日: 2021-11-22
公开(公告)号: CN114816979A 公开(公告)日: 2022-07-29
发明(设计)人: 李震;杨学刚;李彤;王泽威 申请(专利权)人: 江苏科技大学
主分类号: G06F11/36 分类号: G06F11/36;G06K9/62
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 柏尚春
地址: 212008 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 聚类分析 决策树 算法 软件 缺陷 预测 方法
【权利要求书】:

1.一种基于聚类分析和决策树算法的软件缺陷预测方法,其特征在于,包括以下步骤:

(1)用网络爬虫技术对预测所需的开源网站的软件信息进行爬取;

(2)利用新度量元对大量样本数据进行分析,最终生成execl数据表格;

(3)使用聚类分析技术,通过发掘数据样本内部的簇结构,把样本的多种特性进行定量表示,并且采用特定指标对样本进行具体的刻画,找出样本之间的相似性;最后根据数据的内在相似性将数据划分成多个类别形成家族簇;

(4)对这些样本运用决策树算法进行分析,根据之前的样本判断类别,形成完成分类的历史版本数据集;

(5)根据分类数据,以及引用的度量元、指标信息形成谱系图;

(6)利用已有的谱系数据对新获得的信息结构进行判断,区分新版本的软件信息与历史版本之间数据信息的相同点与不同点,根据与历史版本谱系比较确定软件缺陷范围,从而预测当前版本缺陷。

2.根据权利要求1所述的一种基于聚类分析和决策树算法的软件缺陷预测方法,其特征在于,使用步骤(2)中所述的两大类新型度量元,能够对不同语言的软件进行全面分析。

3.根据权利要求1所述的一种基于聚类分析和决策树算法的软件缺陷预测方法,其特征在于,所述步骤(3)具体为:

(3.1)基于样本选定要聚类的类别数目k,选择k个中心点;以上述新度量元度量后的特征为中心点,并且不重复使用中心点,选用不同的度量元特征,为中心点进行下述步骤。

(3.2)针对每个样本点,找到距离其最近的中心点,距离同一中心点最近的点为一个类,由此完成一次聚类;

(2.3)判断聚类前后的样本点的类别情况是否相同,如果相同,则算法终止,否则进入(2.4);

(3.4)重新选用以改进后的度量元信息特征,当做该类的新的中心点,继续(3.2)。

4.根据权利要求1所述的一种基于聚类分析和决策树算法的软件缺陷预测方法,其特征在于,所述步骤(4)具体为:

(4.1)树以代表训练样本的单个结点开始;

(4.2)如果样本都在同一个类,则该结点成为树叶,并用该类标记;否则,算法选择最有分类能力的属性作为决策树的当前结点;

(4.3)根据当前决策结点属性取值的不同,将训练样本数据集分为若干子集,每个取值形成一个分枝,有几个取值形成几个分枝;重复进行先前步骤,一旦一个属性出现在一个结点上,就不必在该结点的任何后代考虑它;

(4.4)递归划分步骤仅当下列条件之一成立时停止:

A、给定结点的所有样本属于同一类;

B、没有剩余属性可以用来进一步划分样本;在这种情况下,使用多数表决,将给定的结点转换成树叶,并以样本中元组个数最多的类别作为类别标记,同时也可以存放该结点样本的类别分布;

C、如果某一分枝,没有满足该分支中已有分类的样本,则以样本的多数类创建一个树叶。

5.根据权利要求1所述的一种基于聚类分析和决策树算法的软件缺陷预测方法,其特征在于,所述步骤(6)具体为:

(6.1)根据软件的历史版本的数目、度量关系及软件缺陷数据形成谱系图;

(6.2)对需要进行软件缺陷预测的同类型软件进行行分析,得到与谱系分类依据所用到的所有结点、信息的数据;

(6.3)利用已有的谱系数据对新获得的信息结构进行判断;

(6.4)区分新版本的软件信息与历史版本之间数据信息的相同点与不同点;

(6.5)根据与历史版本谱系比较确定软件缺陷范围。

6.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5中任一项所述的一种基于聚类分析和决策树算法的软件缺陷预测方法。

7.一种计算机设备,包括储存器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述的一种基于聚类分析和决策树算法的软件缺陷预测方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏科技大学,未经江苏科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111382959.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top