[发明专利]一种数据模拟方法及装置在审
申请号: | 201910392744.5 | 申请日: | 2019-05-13 |
公开(公告)号: | CN110188037A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 窦志成;孙宝龙;徐诗乐;张晓明;黄真 | 申请(专利权)人: | 北京一览群智数据科技有限责任公司 |
主分类号: | G06F11/36 | 分类号: | G06F11/36 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关联信息 变量信息 模拟数据 数据模拟 生成数据 数据字典 字典 申请 | ||
1.一种数据模拟方法,其特征在于,所述方法包括:
从数据字典中提取各表的变量信息,以及表间的关联信息;
根据提取的变量信息和表间的关联信息,生成数据字典中所有表的模拟数据,所述模拟数据符合表间的关联信息。
2.根据权利要求1所述的方法,其特征在于,所述数据字典包括多条表项,其中,每条表项包含:表名、变量名、规则、格式、范围、分布。
3.根据权利要求1所述的方法,其特征在于,所述表间的关联信息包括父表与子表的关系;其中,若第一表中存在第二表中的id变量,则表明第一表示是第二表的父表,第二表示是第一表的子表;子表的模拟数据生成至少基于父表的id变量、时间变量。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据提取的变量信息和表间的关联信息,生成数据字典中所有表的模拟数据,包括:
根据提取的变量信息和表间的关联信息,生成每个类别的模拟数据;
关联合并模拟数据。
5.根据权利要求4所述的方法,其特征在于,所述关联合并模拟数据,包括:
按照父表到子表的顺序对各表进行排序,按序确定各表需要的数据量;
根据各表需要的数据量关联合并模拟数据。
6.一种数据模拟装置,其特征在于,所述装置包括:
提取单元,用于从数据字典中提取各表的变量信息,以及表间的关联信息;
生成单元,用于根据提取的变量信息和表间的关联信息,生成数据字典中所有表的模拟数据,所述模拟数据符合表间的关联信息。
7.根据权利要求6所述的装置,其特征在于,所述数据字典包括多条表项,其中,每条表项包含:表名、变量名、规则、格式、范围、分布。
8.根据权利要求6所述的装置,其特征在于,所述表间的关联信息包括父表与子表的关系;其中,若第一表中存在第二表中的id变量,则表明第一表示是第二表的父表,第二表示是第一表的子表;子表的模拟数据生成至少基于父表的id变量、时间变量。
9.根据权利要求6至8中任一项所述的装置,其特征在于,所述生成单元,用于根据提取的变量信息和表间的关联信息,生成每个类别的模拟数据;关联合并模拟数据。
10.根据权利要求9所述的装置,其特征在于,所述生成单元,用于按照父表到子表的顺序对各表进行排序,按序确定各表需要的数据量;根据各表需要的数据量关联合并模拟数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京一览群智数据科技有限责任公司,未经北京一览群智数据科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910392744.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种软件测试方法及装置
- 下一篇:一种参数校验方法及装置、校验架构