[发明专利]基于概率的无监督缺陷预测方法有效

专利信息
申请号: 201610395767.8 申请日: 2016-06-06
公开(公告)号: CN106021115B 公开(公告)日: 2018-07-10
发明(设计)人: 徐玲;陆正发;鄢萌;杨梦宁;葛永新;洪明坚;张小洪;周末;杨丹 申请(专利权)人: 重庆大学
主分类号: G06F11/36 分类号: G06F11/36
代理公司: 重庆信航知识产权代理有限公司 50218 代理人: 穆祥维
地址: 400044 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及基于概率的无监督缺陷预测方法,包括如下步骤,S1获取度量元阈值,使用每个度量下源代码类的度量元值的中位数作为阈值;S2度量元值与阈值的差值概率化;S3聚类,计算所有度量元下每个文件的概率之和,具有相同值的类归为一类;S4标记,如果某类文件所对应的概率合大于等于L,则将该类文件标记为有缺陷,否则标记为无缺陷,从而将所有类标记为有缺陷和没有缺陷的两类。本发明方法使用概率表示类存在缺陷的可能性,不同度量元值得到的概率不同,保留类存在缺陷可能性大小的信息。在标记的过程中,根据数据集中缺陷的分布特点,选取合适的临界值进行标记。在避免信息丢失的同时,选择合适的标记临界值,提高了缺陷预测的性能。
搜索关键词: 度量 缺陷预测 概率 无监督 源代码 缺陷可能性 差值概率 方法使用 分布特点 概率表示 数据集中 文件标记 信息丢失 类文件 中位数 聚类 保留
【主权项】:
1.基于概率的无监督缺陷预测方法,其特征在于,包括如下步骤:S1:获取度量元阈值;S1a:获取目标软件的源代码,并获取该目标软件源代码的度量元值;目标软件源代码的所有度量元的值构成一个集合X:X={x1,1,x2,2,...xi,j,...xI,J}  (1);其中,xi,j表示第j个度量元在第i个文件上的度量元值,第i个文件是指第i个源代码的文件,I表示目标软件中源代码文件的总数,J表示选取的度量元的总数;S1b:将每个度量元在所有文件上的度量元值的中位数作为该度量元阈值,见公式(2);Tj=Median(xi,j),i=1,2,3...I,j=1,2,3...J  (2);其中,Tj表示第j个度量元的阈值;S2:度量元值与阈值的差值概率化;S2a:使用公式(3)计算度量元值与其对应的阈值的差值;ui,j=xi,j‑Tj,i=1,2,3...I,j=1,2,3...J  (3);其中,ui,j表示第j个度量元在第i个文件上的度量元值与第j个度量元的阈值的差值;S2b:将步骤S2a的差值使用公式(4)映射为概率;其中,P(ui,j)表示差值ui,j映射后的概率;S3:聚类;S3a:根据公式(5)对通过公式(4)得到概率求和;其中,Ki表示在每个度量元上第i个文件对应的概率P(ui,j)进行求和所得的概率和;S3b:将步骤S3a得到的I个概率和进行比较,将概率和相等的文件归为同一个类别;S4:根据公式(6)对步骤S3b聚类的结果进行标记;如果S3b聚类后,某类别文件所对应的概率和大于等于L,则将该类别中的文件标记为有缺陷,否则标记为无缺陷;其中,L表示临界值,L=J*B,B是经验值,B∈(0,1),F表示待预测的文件的类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610395767.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top