[发明专利]测试数据生成方法及装置在审
申请号: | 202110863087.5 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113568949A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 王有燕;卫柳;周炜;赵颖 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/2455;G06F16/23;G06F16/27 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 刘熔;赵平 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 测试数据 生成 方法 装置 | ||
1.一种测试数据生成方法,其特征在于,包括:
获取生产数据;
抽取所述生产数据中的多个字段特征,并对抽取到的多个字段特征进行统计,得到所述生产数据对应的统计规则;
基于所述统计规则,提取所述生产数据对应的数据规则,其中,所述数据规则用于表征所述多个字段特征的数值之间的依赖关系;
根据所述统计规则和所述数据规则,生成批量的测试数据。
2.根据权利要求1所述的方法,其特征在于,抽取所述生产数据中的多个字段特征,并对抽取到的多个字段特征进行统计,包括以下至少之一:
确定所述生产数据中的指定字段是否为枚举类型数据;
判断所述生产数据中的指定字段是否为有限长度数据;
识别所述生产数据中的指定字段的字符构成;
计算所述生产数据中的指定字段的字段长度的概率分布。
3.根据权利要求2所述的方法,其特征在于,确定所述生产数据中的指定字段是否为枚举类型数据,包括:
读取所述生产数据中的指定字段的数值;
对所述指定字段的数值进行去重,得到所述指定字段的数值的第一数量;
在所述第一数量小于预设数量的情况下,将所述生产数据进行编号,将序号为奇数的生产数据的所述指定字段的数值进行去重,得到序号为奇数的生产数据的所述指定字段的数值的第二数量,将序号为偶数的生产数据的所述指定字段的数值进行去重,得到序号为偶数的生产数据的所述指定字段的数值的第三数量;
判断所述第一数量、所述第二数量和所述第三数量是否相等;
在判定所述第一数量、所述第二数量和所述第三数量相等的情况下,确定所述生产数据的所述指定字段为枚举类型数据;
将去重后的得到的数值作为枚举值,并计算所述枚举值的占比。
4.根据权利要求2所述的方法,其特征在于,判断所述生产数据中的指定字段是否为有限长度数据,包括:
计算所述生产数据的指定字段的字段长度并对计算得到的字段长度进行去重,得到第一字段长度;
将所述生产数据进行编号,计算序号为奇数的生产数据的所述指定字段的字段长度并进行去重,得到第二字段长度,计算序号为偶数的生产数据的所述指定字段的字段长度并进行去重,得到第三字段长度;
确定所述第一字段长度、所述第二字段长度和所述第三字段长度是否相同;
在确定所述第一字段长度、所述第二字段长度和所述第三字段长度相同的情况下,判定所述生产数据的指定字段为有限长度数据;
计算所述第一字段长度中各字段长度的占比。
5.根据权利要求2所述的方法,其特征在于,识别所述生产数据中的指定字段的字符构成,包括:
逐个字符识别所述生产数据的指定字段,得到所述指定字段的字符类型;
若所述指定字段仅包含一种字符类型,则所述指定字段为单一字符类型;
若所述指定字段包括多个字符类型,则计算所述指定字段中各字符类型的构成占比。
6.根据权利要求2所述的方法,其特征在于,计算所述生产数据中的指定字段的字段长度的概率分布,包括:
计算所述生产数据的指定字段的字段长度的平均数和中位数;
在所述平均数和所述中位数之间的差值超过预设范围的情况下,以所述中位数为分割点,将所述生产数据划分为两个区间,并计算分割后得到的两个区间中各区间中的生产数据的所述指定字段的字段长度的平均数和中位数,重复本步骤直至分割得到的区间对应的平均数和中位数不超过预设范围;
计算分割得到的多个区间中各区间中的生产数据的所述指定字段的字段长度的平均数,并将所述各区间对应的平均数作为所述各区间对应的代表字段长度;
计算所述各区间中的生产数据的数量占生产数据总数量的百分比,作为所述各区间对应的占比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110863087.5/1.html,转载请声明来源钻瓜专利网。