[发明专利]一种多对多的数据采集系统及其采集方法在审

专利信息
申请号: 201410758012.0 申请日: 2015-08-04
公开(公告)号: CN104504010A 公开(公告)日: 2015-07-29
发明(设计)人: 郑葵荣;艾建文;安宏伟;季统凯 申请(专利权)人: 国云科技股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 广东莞信律师事务所 44332 代理人: 余伦
地址: 523808 广东省东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 采集 系统 及其 方法
【说明书】:

技术领域

发明涉及计算机应用技术领域,特别涉及一种多对多的数据采集系统及其采集方法。

背景技术

随着计算机应用技术的发展,应用系统间的数据关联越趋紧密,无时无刻都有大量数据信息进行交互。同时,伴随着发展的多样性,各系统数据交互方式不一,当交互方式增加时,数据提供方与接收方均需要额外添加渠道,或者各自建立自己的一套方案来解决这一兼容性问题。当原有交互方式改变时,往往伴随着大量变更工作。

发明内容

本发明解决的技术问题之一在于针对交互方式多样,各系统增加渠道开销大的问题,提供了一种多对多的数据采集系统。实现数据提供方与接收方统一管理,大大减少了多个系统间新增渠道造成的额外开销,保证了采集任务流程化、节点间交互多样性及可扩展性。

本发明解决的技术问题之二在于针对交互方式多样,各系统增加渠道开销大的问题,提供了一种多对多的数据采集系统的采集方法。实现数据提供方与接收方统一管理,减少多个系统间新增渠道造成的额外开销,保证采集任务流程化、节点间交互多样性及可扩展性。

本发明解决上述技术问题之一的技术方案是:

所述的系统由采集管理平台、采集引擎和数据处理服务器构成,并提供相应的开发和集成接口;

所述的采集管理平台,用于管理数据提供方节点、接收方节点、通信协议、ETL规则和采集任务;每一个提供方或接收方作为一个子节点,描述了与平台的交互及状态,通过平台统一管理;通信协议包括了可配置的通信方式及其规则,是数据采集的方式;ETL规则负责对采集文件进行栏位、条件清洗;采集任务是一条包含了节点信息、通信协议、ETL规则以及其他任务补充信息的数据集合;

所述的采集引擎,支持多种通信方式,通过通信协议与数据提供方进行握手,识别提供方的合法性并进行数据采集,通知数据处理服务器;

所述的数据处理服务器,包括了数据清洗和拔插式的数据处理组件;数据清洗模块利用ETL规则以及任务指定的数据处理组件对采集数据进行萃取、转换并加载至目标节点;数据处理组件采用系统提供的标准接口,每一个组件处理一种数据文件,可根据实际情况进行拔插。

所述的采集管理平台提供CRUD访问接口,用于查询及维护节点信息、通信协议、ETL规则和采集任务。

本发明解决上述技术问题之二的技术方案是:

所述的方法中,建立新任务的详细流程是:

第一步,分配提供方和接收方节点编号,维护节点信息;

第二步,维护通信协议,添加通信方式及其规则;

第三步,与数据提供方和接收方进行通信绿灯测试;

第四步,维护ETL规则;

第五步,维护任务信息,添加任务使用的节点信息、通信协议、ETL规则及其他任务补充信息;

第六步,日志记录,完成;

采集引擎的详细工作流程是:

第一步,采集引擎调度服务处于监听状态;

第二步,根据任务循环周期开始执行任务;

第三步,根据任务节点参数验证节点活动状态;

第四步,根据任务通信协议与提供方节点握手,连接成功后检查文件完整性并进行文件采集;

第五步,添加数据清洗任务至数据处理服务器队列;

第六步,日志记录,完成;

数据处理服务器的详细工作流程是:

第一步,数据处理服务器队列处于运行状态;

第二步,分析任务,获取ETL规则、文件类型、目标节点数据库类型及存储位置;

第三步,根据文件类型调用对应的数据处理组件;

第四步,根据ETL规则对数据文件进行萃取、转换及入库;

第五步,日志记录,完成。

本发明针对交互方式多样,各系统增加渠道开销大的问题,通过管理平台、引擎和服务器的三大部件,将多个系统以节点的模式通过采集、清洗、入库任务链紧密结合在一起。管理平台统一管理节点、通信协议、ETL规则和任务,实现任务流程化管理;采集引擎支持协议多样性,提供标准接口,保证了协议可扩展;数据处理服务器支持可拔插的数据处理模块,同时将任务以队列的方式进行自动化处理。

附图说明

下面结合附图对本发明进一步说明:

图1是本发明的总体结构图;

图2是本发明的总体流程框图;

图3是本发明任务流程的序列图;

图4是本发明数据处理服务器的处理活动图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410758012.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top