[发明专利]面向用户数据覆盖率的测试用例自动生成方法有效
申请号: | 201711195641.7 | 申请日: | 2017-11-24 |
公开(公告)号: | CN107957944B | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 温盈盈;尹建伟;吴朝晖;邓水光;李莹 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 用户 数据 覆盖率 测试 自动 生成 方法 | ||
1.一种面向用户数据覆盖率的自动生成测试用例的方法,包括以下步骤:
(1)获得某软件产品的用户使用数据,组成数据集Dorigin,并清洗所述数据集Dorigin得到数据集Dclean;
(2)采用机器学习方法处理所述数据集Dclean,获得测试用例集TC,具体包括:
(2-1)基于所述数据集Dclean中的N个数据特征,将所述数据集Dclean映射到N个数据特征上,组成数据特征集P={Pi,1≤i≤N},并获得每个数据特征上数据的映射值,Pi表示第i个数据特征;
(2-2)根据数据特征Pi上的数据分布特点,确定所述数据特征Pi上数据划分的数量ki,并采用聚类算法对所述数据特征Pi上数据自动聚类成ki类,
(2-3)基于自动分类结果,将所述数据特征Pi上数据划分成ki类,每类数据用Ci,j表示,并基于Ci,j中包含数据实例的个数,为Ci,j赋予权重Wi,j,其中,1≤j≤ki;
(2-4)计算Ci,j包括的数据的均值,将所述均值作为Ci,j的代表性中心点Oi,j;
(2-5)将N个数据特征上的所有代表中心点Oi,j进行交叉合成,获得多个测试用例取值组合;
(2-6)根据权重Wi,j计算每个测试用例取值组合的综合权重,选取综合权重排在前50%~75%大的测试用例取值组合组成测试用例集TC;
所述权重Wi,j的计算过程为:
统计所述数据集Dclean中数据实例的个数Ntotal,统计Ci,j中包含数据实例的个数ni,j,则权重Wi,j为:
所述综合权重的获取过程为:
将每个测试用例取值组合包含的所有代表中心点Oi,j对应Ci,j的权重Wij相乘,获得该测试用例取值组合的综合权重;
(3)利用所述测试用例集TC对所述某软件产品进行测试,修复已经出现的漏洞,重复测试直至无严重漏洞,并将修复后的某软件产品重新投入使用;
(4)记录重新投入使用的某软件产品的用户使用数据,组成数据集Dadd,合并所述数据集Dadd和所述数据集Dorigin,得到作为下一轮测试用的数据集Dorigin’。
2.如权利要求1所述的面向用户数据覆盖率的自动生成测试用例的方法,其特征在于,所述清洗所述数据集Dorigin得到数据集Dclean包括:
判断所述数据集Dorigin中数据量是否足够,
若是,直接删除掉所述数据集Dorigin中的异常数据,得到所述数据集Dclean;
若否,对所述数据集Dorigin中的重复数据、关键字段缺失数据进行初步清洗,并格式规整初步清洗完的数据,获得所述数据集Dclean。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711195641.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置