[发明专利]动态化数据质量分析方法及平台系统有效
申请号: | 201910695740.4 | 申请日: | 2019-07-30 |
公开(公告)号: | CN110472109B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 曾崛;汪浩 | 申请(专利权)人: | 深圳中科保泰空天技术有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 曹柳 |
地址: | 518000 广东省深圳市龙华*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动态 数据 质量 分析 方法 平台 系统 | ||
本申请实施例适用于大数据技术领域,公开了一种动态化数据质量分析方法及平台系统,其中,方法包括:获取待分析数据;动态配置和/或动态增加待分析数据对应的质量分析策略;根据质量分析策略,为待分析数据打上质量标签,生成标签数据。本申请实施例通过获取待分析数据,为待分析数据打上质量标签,得出质量分析结果,舍弃了传统的硬编码形式,数据质量维护容易、可统一管理以及灵活配置。
技术领域
本申请属于大数据技术领域,尤其涉及一种动态化数据质量分析方法及平台系统。
背景技术
当今社会,数据量正迅猛增长,数据的表示形式千变万化,标志着我们已经进入了大数据时代。而大数据时代的到来,对数据管理和从数据中提取有价值的信息提出了挑战。数据质量是有效分析和利用大数据的前提,是大数据产生跨区域、跨行业和跨部门价值的保障。
大数据是企业决策的基础,但是,单纯的数据量的积累不会对企业产生任何益处,只有建立适当的分析模型,并运用相应的技术手段,对大量的数据进行有效的深入加工,以此来发现隐含在大量数据中的信息并加以利用进而指导企业做出相关决策,才能将大数据的真正效用发挥到极致。
然而,目前的业务系统的数据质量分析基本都使用硬编码形式实现,存在数据质量规则维护困难、缺乏统一管理以及不够灵活等问题。
发明内容
本申请实施例提供一种动态化数据质量分析方法及平台系统,以解决数据质量规则维护困难、缺乏统一管理以及不够灵活等问题问题。
第一方面,本申请实施例提供一种动态化数据质量分析方法,包括:
获取待分析数据;
动态配置和/或动态增加所述待分析数据对应的质量分析策略;
根据所述质量分析策略,为所述待分析数据打上质量标签,生成标签数据。
结合第一方面,在一种可能的实现方式中,所述动态配置和/或动态增加所述待分析数据对应的质量分析策略,包括:
从所述待分析数据的元数据中确定目标元数据,所述目标元数据为需要进行质量分析的元数据;
判断是否存在目标元数据对应的目标质量分析策略;
当存在所述目标质量分析策略时,通过动态配置将所述目标质量分析策略作为所述质量分析策略;
当不存在所述目标质量分析策略时,动态增加所述目标元数据对应的质量分析策略。
结合第一方面,在一种可能的实现方式中,在判断出存在所述目标质量分析策略之后,还包括:
判断所述目标质量分析策略是否可用于所述目标元数据;
当所述质量分析规则可用于所述目标元数据时,进入将所述目标质量分析策略作为所述质量分析策略的步骤。
结合第一方面,在一种可能的实现方式中,所述动态增加所述目标元数据对应的质量分析策略,包括:
判断所述元数据是否满足质量分析策略的使用要求;
当所述元数据满足所述使用要求时,判断所述目标元数据是否为结构化数据;
当所述目标元数据为结构化数据时,动态配置并启用所述目标元数据对应的质量分析规则;
当所述目标元数据为非结构化数据时,选择与所述目标元数据对应的算法,并设定算法参数,启用所述目标元数据对应的质量分析算法。
结合第一方面,在一种可能的实现方式中,在所述判断所述元数据是否满足质量分析策略的使用要求之后,还包括:
当所述元数据不满足所述使用要求时,确定缺少的元数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中科保泰空天技术有限公司,未经深圳中科保泰空天技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910695740.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置