[发明专利]基于聚类分析的测试程序分类方法有效

专利信息
申请号: 201910975074.X 申请日: 2019-10-14
公开(公告)号: CN112732549B 公开(公告)日: 2023-10-17
发明(设计)人: 谭坚;王丽一;马腾;胡夏晖;相陈伟;陈佳;蒋丽萍;韩肖 申请(专利权)人: 无锡江南计算技术研究所
主分类号: G06F11/36 分类号: G06F11/36;G06F18/23213;G06F18/24
代理公司: 苏州科旭知识产权代理事务所(普通合伙) 32697 代理人: 王健
地址: 214083 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 聚类分析 测试 程序 分类 方法
【权利要求书】:

1.一种基于聚类分析的测试程序分类方法,其特征在于:包括以下步骤:

S1、在多个处理器上批量运行测试程序,每个处理器上配置各不相同,采用在不同处理器上获取不同的性能计数事件数据的策略,在对性能计数事件数据进行收集的过程中,通过增加处理器资源和运行遍数的方式增加冗余开销,以生成冗余数据,用于校验并生成后续误差,以保证同一道课题至少有一次以上的数据是完整有效的,从而在测试程序一次运行过程中获取所有维度的性能计数事件数据,并行化采集测试程序的各项性能计数事件数据,并将采集到的性能计数事件数据以字符串的形式存储在文本中;

S2、根据S1中获取的性能计数事件数据,对高维度性能计数事件数据进行降维处理,基于性能计数事件相互之间的关联,分析不同特征关联的性能计数事件数据,去除其中无效数据和冗余数据,将原本存储在文本中字符串形式的性能计数事件数据通过python工具的numpy.loadtxt函数接口转换为机器学习算法能够处理的向量数据;

S3、将S2中得到降维处理之后的有效性能计数事件数据,作为课题特征的特征数据,并作为机器学习算法的输入,建立K_means算法模型,根据所需获取的典型课题特征种类,根据典型课题数目确定分类总数K,并选取各个课题在S2中对应的性能计数事件数据作为初始质心,利用建立的K_means算法模型对S2中的结果向量数据进行计算并分类,分类结果值为K-Means的分类编号0,1,…,K-1;

S4、利用S1中增加的冗余开销所生成的冗余数据,判断同一课题在不同核心的性能计数事件数据是否在同一分类中判别K_means得到的分类是否正确,以此分类出错的比例得到误差率;

S5、将S4中形成的误差率作为卷积神经网络模型中的交叉熵的损失函数输入,通过卷积神经网络模型评估S3中获得的分类结果,以S4中得到的误差率是否小于0.1%来判断是否满足模型评估要求;如果是,则以本次迭代运算的分类结果作为程序分类最终结果输出,程序结束;否则,表明程序分类结果还不精确,则利用卷积神经网络模型中自带的反馈的方式,减少本应属于同一类分类的权重值,修正K_means计算过程中计算距离的权重值,重复S3。

2.根据权利要求1所述的基于聚类分析的测试程序分类方法,其特征在于:

所述K_means算法模型中的各个类别的初始质心的选取依赖于测试题库中出错较多的典型课题,即以典型课题的数据作为初始质心。

3.根据权利要求1所述的基于聚类分析的测试程序分类方法,其特征在于:所述降维处理针对课题的不同,其处理过程也不同。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910975074.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top