[发明专利]数据标准符合性检测方法、装置、系统及存储介质有效
申请号: | 201910957541.6 | 申请日: | 2019-10-10 |
公开(公告)号: | CN110737689B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 姚祖发;尹榕慧;曹强;肖祥春;许颖媚;冯轶华;胡宇辉;谭建恩;卓廷海;钟真毅 | 申请(专利权)人: | 广东省科技基础条件平台中心 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 黄诗彬;郝传鑫 |
地址: | 510033 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 标准 符合 检测 方法 装置 系统 存储 介质 | ||
本发明公开了一种数据标准符合性检测方法,包括:提取待测数据库中的待测数据元;根据同义词映射规则对将所述待测数据元进行匹配,得到所述待测数据元的同义词;根据所述同义词在数据检测规则池中查找对应的检测规则,根据对应的所述检测规则对所述待测数据元进行数据标准符合性检测。本发明实施例还公开了一种数据标准符合性检测装置、系统及存储介质,采用多个实施例解决了现有技术中人工检测数据标准符合性准确性低的问题。
技术领域
本发明涉及数据检测技术领域,尤其涉及数据标准符合性检测方法、装置、系统及存储介质。
背景技术
随着互联网、大数据、物联网和人工智能时代的到来,数据日益成为重要的生产资料和战略资源。大数据时代的出现吸引了工业界、学术界和政府的关注。高质量的数据是提升其社会价值和生产潜力的重要前提。国内外各界从多维角度评价数据质量,有些领域结合行业特点开发数据质量检测系统来监控数据质量问题。数据质量是一个多维的概念,数据标准化处理是指参照相关的国家标准或行业标准,已保证不同分类体系间的协调一致和转换,是提升项目数据质量的重要方式。
目前我国基于标准的数据质量测试方面的研究在审计、教育、医疗卫生、交通运输、新闻出版、国际贸易等行业有了一些研究进展,在部分行业中也有了数据分类兼容性测试工具,能够高效准确完成数据分类兼容性测试任务。同时,也应该看到在当前大数据引领传统产业转型升级的重要战略机遇期,我国还存在严重的“数据丰富,信息匮乏”矛盾,现有数据质量评估依据国家/行业标准,对标准的实现进行测试,判别一个标准的实现(如产品、过程与服务)与所对应的标准描述是否一致,其实现方式大多是通过人工核查开展相关测试工作,大数据环境下测试效率较低,测试方法缺乏针对性,测试结果的可信度存在很大不确定性。当前数据验收评审手段的权威性、公正性不足,归纳为两方面原因:一是专家经验不足以精确判定信息系统中数据内容与标准的符合度;二是大部分数据验收属于自律性质的第一方自我声明和第二方验收活动,缺乏权威的第三方测试。
发明内容
本发明实施例提供一种数据标准符合性检测方法、装置、系统及存储介质,使得数据质量检测智能化。
本发明一实施例提供一种数据标准符合性检测方法,包括:
提取待测数据库中的待测数据元;其中,数据元包括:数据元字符类型以及值域;
根据同义词映射规则对将所述待测数据元进行匹配,得到所述待测数据元的同义词;
根据所述同义词在数据检测规则池中查找对应的检测规则,根据对应的所述检测规则对所述待测数据元进行数据标准符合性检测;
其中,所述检测规则包括:规则类别规则、应用标准规则、数据类型规则、数据长度范围规则、数据格式以及取值范围规则。
作为上述方案的改进,所述数据检测规则池,具体包括:
根据各行各业的标准文件的应用范围进行分类;
将所述标准文件转换成可识别的检测规则。
作为上述方案的改进,将所述标准文件转换成可识别的检测规则,具体包括:
若所述标准文件中的数据元的值域能够通过正则表达式检测,则对所述标准文件进行转化,转化得到所述标准文件对应的规则类别规则、应用标准规则、数据类型规则、数据长度范围规则、数据格式规则以及取值范围规则;
或,
若所述标准文件中的数据元的取值有预设的取值范围或取值列表,则通过预设的本地值范围或预设的外部引用表值范围配置所述数据元对应的值域;
若所述数据元的值域能够通过正则表达式检测,则对所述标准文件进行转化,转化得到所述标准文件对应的规则类别规则、应用标准规则、数据类型规则、数据长度范围规则、数据格式规则以及取值范围规则;
或,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省科技基础条件平台中心,未经广东省科技基础条件平台中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910957541.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置