[发明专利]一种基于数据库分库分表的生产数据进行测试的方法有效
申请号: | 202110336106.9 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113094262B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 黄勇;张妍洁;郑婷;石清;熊阳 | 申请(专利权)人: | 四川新网银行股份有限公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F21/62 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 濮云杉 |
地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据库 分库分表 生产 数据 进行 测试 方法 | ||
本发明公开了一种基于数据库分库分表的生产数据进行测试的方法,涉及软件测试领域,包括:S1:设计数据库分库分表用户数据保存方法;S2:生产数据库抽样;S3:基于数据进行业务测试验证。本发明的有益效果:通过预先对用户的所有数据都绑定一个分库分表索引和一个用户唯一编号ID,并一起保存,实现用户所有数据的区分并确保所有用户数据都存放在一个数据库分片上;通过预设的抽样置信度及误差率计算出最低抽样数,通过数据库分库分表取模系数、取模余数和抽样的取模倍数因子,确定数据的抽样量且不小于最低抽样数,并通过取模系数、取模余数、抽样的取模倍数因子的组合,能够在保证用户数据完整性的情况下,极大的减少数据的抽样量。
技术领域
本发明涉及软件测试领域,尤其是一种基于数据库分库分表的生产数据进行测试的方法。
背景技术
现有技术方案:
1.如果需要生产数据用于测试环境,主要是通过将生产数据全部下载到测试环境,然后导入测试环境数据库,才能进行测试,该方案在数据库数据量非常大时,存在导出生产数据并导入测试环境成本非常高且耗时长的问题。
2.通过梳理出用户数据库表之间的结构关系,筛选出特定用户的数据进行测试,然后从生产环境导出数据再导入测试环境,当数据库表很多且结构复杂的情况下,该方案执行难度大且成本高。
与本发明相关的技术点:
置信度:也叫可靠度,或置信水平,置信系数,它是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度。
置信水平是指构造总体参数的多个样本区间中,包含总体参数的区间占总数之比,一般用1-α表示;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。
发明内容
针对上述现有技术中存在的不足,本发明的目的在于一种基于数据库分库分表的生产数据进行测试的方法,解决现有技术成本高且效率低的问题。
为解决上述问题,本发明公开了一种基于数据库分库分表的生产数据进行测试的方法,包括以下步骤:步骤1:设计数据库分库分表用户数据保存方法;步骤2:生产数据库抽样;步骤3:基于数据进行业务测试验证;
其中,步骤1的具体方法如下:
1.1预先确定需要将生产用户数据均匀存储到多少台数据库机器上,将数据库机器的台数设置为取模系数;
1.2对每一个用户ID,生成一条唯一用户ID索引;并随机生成一条N位长度的数据库分库分表索性;将该用户的唯一用户ID索引及分库分表索引一起组成一条用户的标识记录,并按照步骤1.3保存到特定的数据库分片上;
1.3对数据库分库分表索性进行取模,取模数为步骤1.1设置的取模系数,根据取模余数,确定用户数据分布应该分配到哪个数据库分片上;
步骤2的具体方法如下:
2.1了解生产数据库的数据量大小,并按照统计概率理论算出置信率为M%的抽样数据量大小,根据实际的测试需要的数据量大小确定对几片数据库进行数据抽样;
2.2确定数据库分库分表取模系数,确定每一分片数据库的取模余数,确定数据库抽样的取模倍数因子;
2.3通过取模系数与抽样的取模倍数因子相乘,获得抽取取模系数;
2.4对确定需要抽样的分片数据库里的数据表进行抽样,对每一张表里面的每条数据的分库分表索引以抽取取模系数为系数进行取模,将余数等于分片数据库的取模余数的数据取出并导出为一个抽样分片数据库。
作为优选,步骤1还包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110336106.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种检查电子合同的方法
- 下一篇:一种皮肤疾病皮损范围测量系统