[发明专利]数据提取方法、系统、处理器及电子设备在审

专利信息
申请号: 202211392705.3 申请日: 2022-11-08
公开(公告)号: CN115757574A 公开(公告)日: 2023-03-07
发明(设计)人: 何璐 申请(专利权)人: 中国工商银行股份有限公司
主分类号: G06F16/25 分类号: G06F16/25;G06F16/22;G06Q10/0639;G06F11/36
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 黄海英
地址: 100140 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 提取 方法 系统 处理器 电子设备
【说明书】:

本申请公开了一种数据提取方法、系统、处理器及电子设备。涉及云计算领域,该方法包括:确定测试需求指标,并在第一数据源上根据测试需求指标构建包含多个字段类型的数据提取表;通过数据提取表在第一数据源上提取数据,得到多个第一提取数据;判断多个第一提取数据的字段类型是否已包含数据提取表全部的字段类型;在多个第一提取数据的字段类型未包含数据提取表全部的字段类型的情况下,通过数据提取表在第二数据源提取数据,得到多个第二提取数据;将多个第一提取数据和多个第二提取数据确定为满足测试需求指标的测试数据。通过本申请,解决了相关技术中从多个数据源提取需要的测试数据时需要手动准备数据,导致提取测试数据的效率低的问题。

技术领域

本申请涉及云计算领域,具体而言,涉及一种数据提取方法、系统、处理器及电子设备。

背景技术

随着大数据平台对接的数据源类型日益丰富,不同的数据源可支持数据编码格式,字段类型、特殊字符等特性差异性较大,测试人员在测试数据准备工作中需要对每种数据源的特性都十分了解才能准备出符合需求的测试数据,因此测试数据准备工作对测试人员的技术门槛存在一定要求。

相关技术中,在对测试数据进行准备时,测试人员需要在不同的数据源手动提取数据,再利用导数工具将提取的数据导入进行测试的系统,不同数据源用到的导数工具也不同,导数过程中导数工具的编码格式、脚本编码格式等诸多因素都会导致测试数据的不准确,操作起来也十分繁琐不便;另外,在大数据批量加工处理过程中,对数据的离散程度、数据量级也有一定要求,人工造数对数据离散性的控制较难,因此利用导数工具时是从数据源对应的生产环境直接导数,导数流程耗费的时间较长,也影响了测试人员对测试进度的把控。

针对相关技术中从多个数据源提取需要的测试数据时需要手动准备数据,导致提取测试数据的效率低的问题,目前尚未提出有效的解决方案。

发明内容

本申请的主要目的在于提供一种数据提取方法、系统、处理器及电子设备,以解决相关技术中从多个数据源提取需要的测试数据时需要手动准备数据,导致提取测试数据的效率低的问题。

为了实现上述目的,根据本申请的一个方面,提供了一种数据提取方法。该方法包括:确定测试需求指标,并在第一数据源上根据测试需求指标构建包含多个字段类型的数据提取表,其中,第一数据源为测试需求指标中的数据表类型对应的数据源;通过数据提取表在第一数据源上提取符合测试需求指标的数据,得到多个第一提取数据;判断多个第一提取数据的字段类型是否已包含数据提取表全部的字段类型;在多个第一提取数据的字段类型未包含数据提取表全部的字段类型的情况下,通过数据提取表在第一数据源以外的第二数据源提取符合测试需求指标的数据,得到多个第二提取数据;将多个第一提取数据和多个第二提取数据确定为满足测试需求指标的测试数据。

可选地,在第一数据源上根据测试需求指标构建包含多个字段类型的数据提取表包括:获取第一数据源的数据表结构定义方式;确定多个字段类型中每个字段类型的名称,并确定测试需求指标中特殊字符指标和中文字符指标;按照数据表结构定义方式在第一数据源生成一个包含多个字段类型、每个字段类型的名称、特殊字符指标和中文字符指标的数据提取表。

可选地,通过数据提取表在第一数据源上提取符合测试需求指标的数据,得到多个第一提取数据包括:确定第一数据源中符合测试需求指标的数据的至少一个字段类型;将第一数据源中每个字段类型的数据值添加至数据提取表,得到第一提取数据;通过数据提取表在第一数据源以外的第二数据源提取符合测试需求指标的数据,得到多个第二提取数据包括:确定第二数据源中符合测试需求指标的数据的除第一数据源中的字段类型以外的其他字段类型;将第二数据源中每个其他字段类型的数据值添加至数据提取表,得到第二提取数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211392705.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top