[发明专利]数据质量检测方法、装置及设备在审
申请号: | 202210045134.X | 申请日: | 2022-01-14 |
公开(公告)号: | CN116483809A | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 贾书娴 | 申请(专利权)人: | 浙江菜鸟供应链管理有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/242;G06F16/2453 |
代理公司: | 北京君以信知识产权代理有限公司 11789 | 代理人: | 钱秀茹 |
地址: | 311121 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 质量 检测 方法 装置 设备 | ||
1.一种数据质量检测方法,其特征在于,包括:
确定多个数据表的多个目标字段;
生成各数据表的数据探查指令;
并行执行多个数据表的数据探查指令,以对多个数据表的多个目标字段并行执行数据探查。
2.根据权利要求1所述的方法,其特征在于,所述确定多个数据表的多个目标字段,包括:
获取字段的使用频次;
根据所述使用频次,确定目标字段。
3.根据权利要求1所述的方法,其特征在于,所述确定多个数据表的多个目标字段,包括:
确定数据表的重要程度;
根据所述重要程度,确定目标数据表;
将目标数据表的字段作为目标字段。
4.根据权利要求1所述的方法,其特征在于,所述生成各数据表的数据探查指令,包括:
根据目标字段的字段类型,生成用于确定目标字段的数据质量指标的查询子句。
5.根据权利要求1所述的方法,其特征在于,所述数据表的数据探查指令,采用如下方式生成:
生成读取所述数据表的多个目标字段数据的语句;
生成根据读取到的多个目标字段数据对所述多个目标字段并行执行数据探查的语句。
6.根据权利要求1所述的方法,其特征在于,周期性执行所述方法;
所述方法还包括:
存储历史数据探查结果;
根据当前数据探查结果和历史数据探查结果,获取所述数据表的元数据变化信息;
展示所述元数据变化信息。
7.根据权利要求6所述的方法,其特征在于,所述根据当前数据探查结果和历史数据探查结果,获取所述数据表的元数据变化信息,包括:
获取当前数据探查结果相对历史数据探查结果的波动数据;
根据所述波动数据,获取所述数据表的数据源的元数据变化信息。
8.根据权利要求1所述的方法,其特征在于,周期性执行所述方法;
所述方法还包括:
存储历史数据探查结果;
若当前数据探查结果符合质量合格条件、但相对历史数据探查结果的波动数据符合异常波动条件,则将当前数据探查结果作为异常数据。
9.一种数据质量检测装置,其特征在于,包括:
字段确定单元,用于确定多个数据表的多个目标字段;
指令生成单元,用于生成各数据表的数据探查指令;
指令并行执行单元,用于并行执行多个数据表的数据探查指令,以对多个数据表的多个目标字段并行执行数据探查。
10.一种电子设备,其特征在于,包括:
处理器和存储器;
存储器,用于存储实现根据权利要求1至8任一项所述的数据质量检测方法的程序,该设备通电并通过所述处理器运行该方法的程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江菜鸟供应链管理有限公司,未经浙江菜鸟供应链管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210045134.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加工中心
- 下一篇:对象推荐方法、装置和电子设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置