[发明专利]一种基于K-MEANS算法测试产品的方法、系统、设备和存储介质在审
申请号: | 202210595423.7 | 申请日: | 2022-05-29 |
公开(公告)号: | CN114780438A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 吴磊;王电轻 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 宋薇薇;马鹏林 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 means 算法 测试 产品 方法 系统 设备 存储 介质 | ||
本发明提供一种基于K‑MEANS算法测试产品的方法、系统、设备和存储介质,方法包括:根据存储交付的功能特性数确定选取的特性,并从每个选取的特性中随机选取预设数量个样本以组成训练样本集;对所述训练样本集中的样本进行特征选择,从原始样本集中选出一个子集来最小化冗余和最大化与目标的相关性以得到样本子集,并根据样本子集得到样本集合;根据所述样本集合通过K‑MEANS算法进行快速聚类以选出预设数量个聚类中心;以及将所有缺陷聚合到对应的聚类中心中,并根据聚类结果确认缺陷集中的模块。本发明通过K‑MEANS聚类算法进行模块缺陷聚类,寻找缺陷集中的子模块,对精准测试和提高存储系统的可靠性起到关键作用。
技术领域
本发明涉及存储测试领域,更具体地,特别是指一种基于K-MEANS算法测试产品的方法、系统、设备和存储介质。
背景技术
随着IT(Information Technology,信息技术)领域技术的不断发展,金融等行业数据中心对存储系统的可靠性要求越来越高,这就对存储系统的可靠性提出了严格的要求,而软件系统的缺陷是无法穷尽的,在软件测试活动中,80%的缺陷发生在20%的模块中,这就需要对精准测试提出了较高的要求,基于存储系统往往出现缺陷集群的效应,且这些缺陷涉及的模块或者子模块往往是频繁出现的,因此特别需要软件测试人员通过对已测试出来的bug(漏洞)进行缺陷分析,快速找到缺陷集中的子模块进行质量加固,特别是在回归测试时,这将决策产品如何选择测试模块和用例集。由于版本迭代快,不可能选择所有的用例进行测试覆盖,而且还要决策重点反复测试哪些模块或子模块。当想要探索存储系统集中出现问题的模块时,通过缺陷分析是一种很好的方法,但是对于大型的功能模块,像存储NAS,FC SAN将面临大量的测试用例,这就无法快速寻找到缺陷集中的子模块进行质量加固和测试覆盖了。
传统缺陷分析方法往往是通过分类的方式进行分析的,首先把缺陷进行特征标记,每个缺陷都会生成一组特征数据,通过这个特征数据把不同的缺陷划分开,其过程是通过人工训练缺陷数据集获得一个分类器,再通过分类器对新的缺陷分类,这属于有监督的学习,这依赖先验知识的积累,且存在认知瓶颈,只能分类已知的特征,但是存储系统代码量庞大,逻辑复杂,不是通过有限认知就可以覆盖所有特性模块的,模块分类比较笼统,譬如远程复制模块,其实按拓扑类型分为FC远程复制和IP远程复制,按照同步类型包含了同步远程复制、异步远程复制和周期异步复制子功能模块,而每个子功能模块中都包含启动远程复制、停止远程复制和切换远程复制等,因此缺陷分析时分类太笼统会导致测试覆盖范围及其庞大。
发明内容
有鉴于此,本发明实施例的目的在于提出一种基于K-MEANS算法测试产品的方法、系统、计算机设备及计算机可读存储介质,本发明通过K-MEANS聚类算法进行模块缺陷聚类,寻找缺陷集中的子模块,作为版本测试或回归验证的重要依据,对精准测试和提高存储系统的可靠性起到关键作用。
基于上述目的,本发明实施例的一方面提供了一种基于K-MEANS算法测试产品的方法,包括如下步骤:根据存储交付的功能特性数确定选取的特性,并从每个选取的特性中随机选取预设数量个样本以组成训练样本集;对所述训练样本集中的样本进行特征选择,从原始样本集中选出一个子集来最小化冗余和最大化与目标的相关性以得到样本子集,并根据样本子集得到样本集合;根据所述样本集合通过K-MEANS算法进行快速聚类以选出预设数量个聚类中心;以及将所有缺陷聚合到对应的聚类中心中,并根据聚类结果确认缺陷集中的模块。
在一些实施方式中,所述从每个选取的特性中随机选取预设数量个样本以组成训练样本集包括:将产品缺陷数据进行标准化处理,并对样本特征设置对应的权重以使得样本数据标准且处于同一维度。
在一些实施方式中,所述根据所述样本集合通过K-MEANS算法进行快速聚类以选出预设数量个聚类中心包括:从所述样本集合中随机选取一个样本点作为初始聚类中心;计算每个样本与当前已有聚类中心之间的最短距离,根据所述最短距离计算每个样本点被选为下一个聚类中心的概率,并将最大概率值对应的样本点作为下一个聚类中心;以及重复上述步骤直到选择出预设数量个聚类中心。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210595423.7/2.html,转载请声明来源钻瓜专利网。