[发明专利]一种多对多的数据采集系统及其采集方法在审
申请号: | 201410758012.0 | 申请日: | 2015-08-04 |
公开(公告)号: | CN104504010A | 公开(公告)日: | 2015-07-29 |
发明(设计)人: | 郑葵荣;艾建文;安宏伟;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广东莞信律师事务所 44332 | 代理人: | 余伦 |
地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 采集 系统 及其 方法 | ||
技术领域
本发明涉及计算机应用技术领域,特别涉及一种多对多的数据采集系统及其采集方法。
背景技术
随着计算机应用技术的发展,应用系统间的数据关联越趋紧密,无时无刻都有大量数据信息进行交互。同时,伴随着发展的多样性,各系统数据交互方式不一,当交互方式增加时,数据提供方与接收方均需要额外添加渠道,或者各自建立自己的一套方案来解决这一兼容性问题。当原有交互方式改变时,往往伴随着大量变更工作。
发明内容
本发明解决的技术问题之一在于针对交互方式多样,各系统增加渠道开销大的问题,提供了一种多对多的数据采集系统。实现数据提供方与接收方统一管理,大大减少了多个系统间新增渠道造成的额外开销,保证了采集任务流程化、节点间交互多样性及可扩展性。
本发明解决的技术问题之二在于针对交互方式多样,各系统增加渠道开销大的问题,提供了一种多对多的数据采集系统的采集方法。实现数据提供方与接收方统一管理,减少多个系统间新增渠道造成的额外开销,保证采集任务流程化、节点间交互多样性及可扩展性。
本发明解决上述技术问题之一的技术方案是:
所述的系统由采集管理平台、采集引擎和数据处理服务器构成,并提供相应的开发和集成接口;
所述的采集管理平台,用于管理数据提供方节点、接收方节点、通信协议、ETL规则和采集任务;每一个提供方或接收方作为一个子节点,描述了与平台的交互及状态,通过平台统一管理;通信协议包括了可配置的通信方式及其规则,是数据采集的方式;ETL规则负责对采集文件进行栏位、条件清洗;采集任务是一条包含了节点信息、通信协议、ETL规则以及其他任务补充信息的数据集合;
所述的采集引擎,支持多种通信方式,通过通信协议与数据提供方进行握手,识别提供方的合法性并进行数据采集,通知数据处理服务器;
所述的数据处理服务器,包括了数据清洗和拔插式的数据处理组件;数据清洗模块利用ETL规则以及任务指定的数据处理组件对采集数据进行萃取、转换并加载至目标节点;数据处理组件采用系统提供的标准接口,每一个组件处理一种数据文件,可根据实际情况进行拔插。
所述的采集管理平台提供CRUD访问接口,用于查询及维护节点信息、通信协议、ETL规则和采集任务。
本发明解决上述技术问题之二的技术方案是:
所述的方法中,建立新任务的详细流程是:
第一步,分配提供方和接收方节点编号,维护节点信息;
第二步,维护通信协议,添加通信方式及其规则;
第三步,与数据提供方和接收方进行通信绿灯测试;
第四步,维护ETL规则;
第五步,维护任务信息,添加任务使用的节点信息、通信协议、ETL规则及其他任务补充信息;
第六步,日志记录,完成;
采集引擎的详细工作流程是:
第一步,采集引擎调度服务处于监听状态;
第二步,根据任务循环周期开始执行任务;
第三步,根据任务节点参数验证节点活动状态;
第四步,根据任务通信协议与提供方节点握手,连接成功后检查文件完整性并进行文件采集;
第五步,添加数据清洗任务至数据处理服务器队列;
第六步,日志记录,完成;
数据处理服务器的详细工作流程是:
第一步,数据处理服务器队列处于运行状态;
第二步,分析任务,获取ETL规则、文件类型、目标节点数据库类型及存储位置;
第三步,根据文件类型调用对应的数据处理组件;
第四步,根据ETL规则对数据文件进行萃取、转换及入库;
第五步,日志记录,完成。
本发明针对交互方式多样,各系统增加渠道开销大的问题,通过管理平台、引擎和服务器的三大部件,将多个系统以节点的模式通过采集、清洗、入库任务链紧密结合在一起。管理平台统一管理节点、通信协议、ETL规则和任务,实现任务流程化管理;采集引擎支持协议多样性,提供标准接口,保证了协议可扩展;数据处理服务器支持可拔插的数据处理模块,同时将任务以队列的方式进行自动化处理。
附图说明
下面结合附图对本发明进一步说明:
图1是本发明的总体结构图;
图2是本发明的总体流程框图;
图3是本发明任务流程的序列图;
图4是本发明数据处理服务器的处理活动图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410758012.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于动态增量式字典更新的学习算法
- 下一篇:高并发下的数据获取方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置