[发明专利]一种数据质量检核方法、系统、设备及可读存储介质有效
申请号: | 201911393892.5 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111209274B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 王新宇;张健博;刘栋梁;王晋民;卢国资 | 申请(专利权)人: | 三盟科技股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/23;G06F16/2455 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 胡枫;曹万菊 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 质量 检核 方法 系统 设备 可读 存储 介质 | ||
本发明公开了一种数据质量检核方法,包括:设置质量检核规则及数据权重规则;将质量检核规则与数据分区进行关联;判断数据分区是否有更新数据输入,判断为是,根据数据分区对应的质量检核规则对更新数据进行检核处理,生成检核结果;根据质量检核规则及数据权重规则计算检核结果的质量权重值;判断质量权重值是否大于预设警报值,判断为是,发送质量警报信息及检核结果,并根据质量处理结果进行二次警报处理,判断为否,对数据分区进行更新处理并发送检核结果。相应地,本发明还公开了一种数据质量检核系统、设备及可读存储介质。采用本发明,可对数据分区的源数据或更新数据进行量化的质量检核,并对数据质量问题进行警报及跟进督促。
技术领域
本发明涉及数据库技术,尤其涉及一种数据质量检核方法、系统、设备及可读存储介质。
背景技术
基于高校现有的数据质量检核,目前采用的技术方法是采用六大质量检核纬度,包括一致性、完整性、准确性、规范性、时效性、关联性等方面,去保障数据质量检核多角度达标。
在现有的高校共享数据中心架构中,数据统一由各个业务部门业务系统采集至数据中心前置节点,在此基础上将数据汇入共享数据中心,通过数据中心进行数据质量检核处理,从而提高学校业务数据质量。
但是,此种做法对数据质量保障仍有部分安全风险存在。在以往的经验中,数据的安全、可靠依赖于业务部门正确的生产、使用和维护数据。在这个过程中,存在着业务部门对数据误操作的风险,而系统并没有提供相应的数据安全保障机制,一旦出现大规模数据的误操作,将严重影响数据中心前置节点数据安全和可靠,进而严重影响共享数据中心整体数据质量。
另外,现有技术还存在以下缺点:
(1)无法对源数据进行质量监控。现有的技术方案是先形成数据标准,再进行数据质量检测,质量检核规则需严格符合数据标准,且质量规则也只适用于标准数据,无法对来源于业务系统的原生数据进行直接检测。
(2)数据入库规则不清晰,对数据入基础层、集市层的规则不清晰,导致无法保障入库的数据符合相应质量要求。数据入库规则无法量化,需要人工介入,无法做到自动入库。
(3)对更新数据缺乏质量验证,无法确保数据更新不出错。现有数据质量检核缺乏对更新后的数据进行检测,无法验证更新过程是否符合规范。
(4)数据问题责任不清晰,缺乏线上处理流程。数据进行转换、加工、清洗后,数据责任方不清晰,也无法对质量问题进行线上统一管理、跟进质量问题。
发明内容
本发明所要解决的技术问题在于,提供一种数据质量检核方法、系统、设备及可读存储介质,可对数据分区的源数据或更新数据进行量化的质量检核,并对数据质量问题及时警报和跟进督促。
为了解决上述技术问题,本发明提供一种数据质量检核方法,包括:设置质量检核规则及数据权重规则;将质量检核规则与数据分区进行关联;判断数据分区是否有更新数据输入,判断为是,根据数据分区对应的质量检核规则对更新数据进行检核处理,生成检核结果;根据质量检核规则及数据权重规则计算检核结果的质量权重值;判断质量权重值是否大于预设警报值,判断为是,向更新数据的数据提供方发出质量警报信息及检核结果,获取数据提供方的质量处理结果,根据质量处理结果进行二次警报处理,判断为否,根据更新数据对数据分区进行更新处理,并向数据提供方发送检核结果。
作为上述方案的改进,设置质量检核规则及数据权重规则的步骤包括:对每个质量检核规则设置规则权重值;对数据权重规则中每个数据项设置对应的数据权重值。
作为上述方案的改进,根据质量检核规则及数据权重规则计算检核结果的质量权重值的步骤包括:判断检核结果中是否有数据项未通过任一质量检核规则的检核,判断为是,逐一计算数据项的质量权重值WQ,并以所有数据项的质量权重值作为检核结果的质量权重值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三盟科技股份有限公司,未经三盟科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911393892.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:参数展示方法、装置和家电设备
- 下一篇:一种空间地理信息大数据处理系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置