[发明专利]数据质量校验方法、设备及计算机可读存储介质在审
申请号: | 202111576645.6 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114238381A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 杨东方;韩海燕;黎君;李元;肖和兵;李朝阳 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2453;G06F16/2455 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 杨培权 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 质量 校验 方法 设备 计算机 可读 存储 介质 | ||
1.一种数据质量校验方法,其特征在于,所述数据质量校验方法包括:
获取输入参数,并从预配置的规则信息定义表中查询出与所述输入参数相关的规则配置信息,其中,所述规则信息定义表与各数据表的描述信息相适配,且底层封装有若干校验规则表达式的校验逻辑;
将所述规则配置信息转化为第一键值对集合,并根据所述输入参数获取到待校验数据表,以将所述待校验数据表转化为第二键值对集合;
将所述第一键值对集合与所述第二键值对集合进行匹配,以匹配得到所述待校验数据表中各字段对应的目标校验表达式;
按照所述目标校验表达式对所述待校验数据表中的各字段进行数据校验,以得到校验结果。
2.如权利要求1所述的数据质量校验方法,其特征在于,所述规则信息定义表包括基础信息表和校验规则定义表,
所述获取输入参数,并从预配置的规则信息定义表中查询出与所述输入参数相关的规则配置信息的步骤包括:
在接收到数据校验指令时,从所述数据校验指令中获取数据库名与数据表名,以作为所述输入参数;
从预配置的基础信息表与校验规则定义表中查询到与所述数据库名和数据表名相关的规则配置信息,其中,所述基础信息表与所述校验规则定义表中均定义有数据库名参数和数据表名参数。
3.如权利要求2所述的数据质量校验方法,其特征在于,所述将所述规则配置信息转化为第一键值对集合的步骤包括:
将所述规则配置信息转化为若干第一键值对,其中,所述第一键值对中的关键字为所述校验规则定义表中所定义的一字段名称,所述第一键值对中的值为所述字段名称分别对应在所述基础信息表和校验规则定义表中的基础信息和校验规则信息;
将若干所述第一键值对汇总为所述第一键值对集合。
4.如权利要求3所述的数据质量校验方法,其特征在于,所述将所述第一键值对集合与所述第二键值对集合进行匹配,以匹配得到所述待校验数据表中各字段对应的目标校验表达式的步骤包括:
将所述第二键值对集合中每一所述第二键值对的关键字与所述第一键值对集合中每一所述第一键值对的关键字进行匹配;
基于匹配成功的第一键值对中的基础信息和校验规则信息生成相应的校验规则表达式,作为匹配成功的第二键值对所对应字段的目标校验表达式。
5.如权利要求1所述的数据质量校验方法,其特征在于,所述根据所述输入参数获取到待校验数据表,以将所述待校验数据表转化为第二键值对集合的步骤包括:
根据所述输入参数生成数据查询sql语句,使用所述sql语句语句查询到所述待校验数据表;
通过分布式计算引擎将所述待校验数据表加载至弹性分布式数据集中;
对所述弹性分布式数据集中的所有分区并行遍历,以将所述所有分区中的每行数据转换成一第二键值对,其中,所述第二键值对的关键字为所述待校验数据表中的实际字段名称,所述第二键值对中的值为所述实际字段名称对应的字段值;
将所述所有分区中的第二键值对汇总为所述第二键值对集合。
6.如权利要求1所述的数据质量校验方法,其特征在于,所述按照所述目标校验表达式对所述待校验数据表中的各字段进行数据校验,以得到校验结果的步骤包括:
确定所述待校验数据表中各字段所匹配到的目标校验表达式之间的依赖关系;
按照所述依赖关系先后对各所述字段执行匹配到的目标校验表达式,以对各所述字段进行数据校验,并得到所述各字段分别对应的校验结果。
7.如权利要求1所述的数据质量校验方法,其特征在于,所述按照所述目标校验表达式对所述待校验数据表中的各字段进行数据校验,以得到校验结果的步骤之后,还包括:
若所述校验结果为异常校验结果,则根据所述异常校验结果生成数据异常提示信息,并确定所述提示信息的告警级别;
将所述待校验数据表中各字段的数据异常提示信息以及告警级别汇总为异常数据汇总表,并将所述异常数据汇总表推送至相关处理人员。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111576645.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置