[发明专利]数据质量评估方法在审
申请号: | 201810173861.8 | 申请日: | 2018-03-02 |
公开(公告)号: | CN108334636A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 唐雪飞;吴云东;汪林川 | 申请(专利权)人: | 成都康赛信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 成都虹盛汇泉专利代理有限公司 51268 | 代理人: | 王伟 |
地址: | 610054 四川省成都市成华区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 质量评估 维度 数据质量管理 配置评估 评估规则 用户体验 质量分数 配置 | ||
本发明提供了一种数据质量评估方法,涉及数据质量管理领域。本发明将体现数据质量的五个维度中的设定各自占比,且针对每个维度配置评估规则,配置好评估规则后,对规则进行逐条运行,得到规则得分,从而得到每个维度的分值,加和得到质量分数,使数据质量评估通过分数的形式简洁明了地展现出来,增加了用户体验。
技术领域
本发明属于数据质量管理领域,具体涉及一种数据质量评估方法。
背景技术
随着科学的发展,各类系统应用越来越繁杂,需要处理的数据也越来越多,数据处理在各种系统应用的建设使用过程中占据着相当重要的位置。
而往往在系统建设过程中会忽视数据质量的重要性,没有采取足够的措施对数据质量进行有效检测,导致随着系统和数据的逐步深入应用,数据质量问题一点点暴露出来,比如数据的有效性、准确性、一致性等。最坏的结果就是用户感觉系统和数据是不可信的,最终放弃了使用系统,这样也就失去了建设系统的意义。
发明内容
为了解决上述问题,本发明提供了一种可对数据质量进行评估的数据质量评估方法。
一种数据质量评估方法,包括以下步骤:
步骤1,导入数据库;
步骤2,筛选数据库中的数据;
步骤3,配置评估规则;
步骤4,运行配置的评估规则进行评估,得到质量分数。
进一步地,所述步骤3包括以下流程:
步骤31,确定数据质量五个维度占比;
步骤32,对五个维度的规则进行配置。
进一步地,所述步骤31中,五个维度为数据的完备性,一致性,及时性,有效性,完整性五个维度。
进一步地,所述步骤32包括以下:
步骤321,选择需要在五个维度中进行评估的规则;
步骤322,配置各规则的权重和阈值。
进一步地,所述步骤4包括以下流程:
步骤41,对每个规则逐条运行,得到每个维度的分值;
步骤42,五个维度的分值加和得到质量分数。
本发明的有益效果:本发明将体现数据质量的五个维度中的设定各自占比,且针对每个维度配置评估规则,配置好评估规则后,对规则进行逐条运行,得到规则得分,从而得到每个维度的分值,加和得到质量分数,使数据质量评估通过分数的形式简洁明了地展现出来,增加了用户体验。
附图说明
图1为本发明的流程图。
图2为图1中步骤3的流程图。
图3为图2中步骤32的流程图。
图4为图1中步骤4的流程图。
具体实施方式
下面结合附图对本发明的实施例做进一步的说明。
请参阅图1,本发明提供一种数据质量评估方法,具体流程如下:
步骤1,导入数据库。
本实施例中,接入需要进行数据质量评估的数据库,对数据库内的数据进行质量评估。
步骤2,筛选数据库中的数据。
本实施例中,根据五个维度,分析数据库中哪些数据对数据质量有影响特别是哪些表格对数据质量有影响,优先选取对数据质量影响大的数据进行数据质量评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都康赛信息技术有限公司,未经成都康赛信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810173861.8/2.html,转载请声明来源钻瓜专利网。