[发明专利]一种面向TAS系统的实时数据清洗与转换方法在审

专利信息
申请号: 201711338916.8 申请日: 2017-12-14
公开(公告)号: CN108062387A 公开(公告)日: 2018-05-22
发明(设计)人: 郭琳云;王建辉;锁军;侯勇;于杰;孙锐;郑宇翔;陈永兴;张恒;焦玉涛 申请(专利权)人: 国网陕西省电力公司电力科学研究院;西安兴汇电力科技有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海精晟知识产权代理有限公司 31253 代理人: 冯子玲
地址: 710000 陕西*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 tas 系统 实时 数据 清洗 转换 方法
【说明书】:

发明涉及一种面向TAS系统的实时数据清洗与转换方法,将TAS系统数据的数据源融合,获取待清洗的数据,对待清洗的数据进行处理,以获取干净数据,将干净数据存入融合数据库中,从而实现多个系统间的数据共享以实现实时数据清洗与转换;本发明通过将TAS系统数据经过抽取/转换/加载的过程,使得在前端展示过程中,不再需要从各自的独立系统获取数据,大大缩短了查询时间,将数据展示的实效性大大提高,同时配置更加灵活,对于元数据的管理也更加便捷,在数据处理中,使得数据的传输更加可靠,增加安全性,满足更高的要求,实现了高效融合、降低同步时间、提高时效性。

技术领域

本发明涉及数据清洗和数据库建模技术领域,具体的说是一种面向TAS系统的实时数据清洗与转换方法。

背景技术

数据是现代企业的重要资源,是企业运用科学管理、决策分析的基础。目前,电力企业花费大量的资金和时间来构建联机事务处理OLTP的业务系统和数据决策系统,用来记录事务处理以及装置采集的各种相关数据。据统计,数据量每2~3年时间就会成倍增长,这些数据蕴含着巨大的应用价值,而企业所关注的通常只占在总数据量的2%~4%左右。在数据清洗的过程中,需要采用ET(Extract-Transform-Load)技术,主要实现:1.根据规则消除数据错误纠正缺失数据;2.将多源数据实现融合,结构化输入;3.提供对于数据可信度的文档化衡量;行业中通常采用通用的技术工具,但是会存在安全性及灵活性的问题,而通过本发明的数据清洗与转换算法方式,在解决以上问题的基础上,同时具备:1.便于直接管理元数据;2.实时同步,高效便捷。

基于此,针对上述现状中存在的局限性,本发明提出了一种使得数据能够高效融合、降低同步时间、提高时效性的面向TAS系统的实时数据清洗与转换方法。

发明内容

为了解决上述现有技术中电力行业对数据实时同步及数据有效性、安全性等更高要求的场合问题,本发明提出了一种使得数据能够高效融合、降低同步时间、提高时效性的面向TAS系统的实时数据清洗与转换方法。

本发明解决其技术问题所采用的技术方案是:

一种面向TAS系统的实时数据清洗与转换方法,将TAS系统数据的数据源融合,获取待清洗的数据,对待清洗的数据进行处理,以获取干净数据,将干净数据存入融合数据库中,从而实现多个系统间的数据共享以实现实时数据清洗与转换,具体步骤包括:

步骤1、通过ETL系统将部署在不同服务器、数据库的数据以及非结构化的数据根据指定的规则进行抽取,将抽取的数据存储到中间层ODS;

步骤2、通过设计目标或清洗提交或规范化提交的方式将ODS的数据进行层层过滤,得到干净的数据;

步骤3:将干净的数据根据设计的业务规则插入或更新到融合数据库中。

进一步地,所述步骤1具体为:

101、在ETL系统设置抓取数据服务模块,抓取数据服务模块根据配置文件信息,获取不同服务器的IP地址,然后连接至各个服务器中的应用;

102、根据指定的规则从各个服务器中抽取数据,将抽取的数据存储到中间层ODS。

进一步地,所述步骤1中的数据来源包括ODBC数据库结构化数据源、平面文件、XML数据源以及日志。

进一步地,所述步骤2中过滤的方式为通过服务器中的应用获取设备目前状态,若该设备为运行态,则抓取相应数据,相反,若该设备为停用、拆除等状态,则丢弃数据,不进入融合数据库。

更进一步地,丢弃的数据为不完整的数据、错误的数据和重复的数据,所述错误的数据在丢弃后进行修复,修复后再抽取。

进一步地,所述步骤3中插入或更新的具体过程为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网陕西省电力公司电力科学研究院;西安兴汇电力科技有限公司,未经国网陕西省电力公司电力科学研究院;西安兴汇电力科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711338916.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top