[发明专利]一种环境健康数据质量核查的自动化报告方法在审
申请号: | 201811035616.7 | 申请日: | 2018-09-06 |
公开(公告)号: | CN109213986A | 公开(公告)日: | 2019-01-15 |
发明(设计)人: | 李湉湉;班婕;王情;孙庆华;杜宗豪 | 申请(专利权)人: | 中国疾病预防控制中心环境与健康相关产品安全所 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F16/2458 |
代理公司: | 北京慧泉知识产权代理有限公司 11232 | 代理人: | 李娜 |
地址: | 100021 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种环境健康数据质量核查的自动化报告方法:步骤一、将数据文件转化为数据流的形式,可供计算机程序批量操作;步骤二、将数据流转化为复杂数据对象,存入数据库;步骤三、依照领域相关研究需求,利用各类数据的校验规则对数据中的各项关键字段进行检查,对于发现的数据问题进行自动化检查和实时记录;步骤四、对于已发现数据中的问题经校验检查后的统计和记录并以审核报告的形式反馈给实施主体。本发明方法够统计大数据,简化了数据种类的复杂性,规避了数据多源异构的问题,统一了数据使用标准,提高了数据质量,从而极大的减轻了核查的人工工作量和方便研究工作的进行。 | ||
搜索关键词: | 环境健康 质量核查 自动化 计算机程序 人工工作量 数据流 多源异构 复杂数据 关键字段 批量操作 实时记录 数据流转 数据使用 数据文件 数据问题 校验规则 检查 校验 大数据 数据库 统计 核查 发现 反馈 研究 审核 记录 转化 统一 | ||
【主权项】:
1.一种环境健康数据质量核查的自动化报告方法,其特征在于:该方法具体包括如下步骤:步骤一自动化数据解析:将数据文件转化为数据流的形式,可供计算机程序批量操作;步骤二数据的归纳整理:将数据流转化为复杂数据对象,存入数据库;步骤三自动化数据校验:依照领域相关研究需求,利用各类数据的校验规则对数据中的各项关键字段进行检查,对于发现的数据问题进行自动化检查和实时记录;其中所述的数据问题包括数据重复、数据缺失、数据大小不合适或不符合经验概念的逻辑性数据错误;步骤四自动化产出核查报告:对于已发现数据中的问题经校验检查后的统计和记录并以审核报告的形式反馈给实施主体,其内容包括:数据的缺失情况,数据的重复情况,数据中存在经验性逻辑错误的聚集情况,并罗列出错误数据的详细位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国疾病预防控制中心环境与健康相关产品安全所,未经中国疾病预防控制中心环境与健康相关产品安全所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811035616.7/,转载请声明来源钻瓜专利网。