[发明专利]海量数据处理中多线程工作包并行的ETL技术有效
申请号: | 200610106551.1 | 申请日: | 2006-07-12 |
公开(公告)号: | CN1897025A | 公开(公告)日: | 2007-01-17 |
发明(设计)人: | 赵懿敏;李捷;曹小华;郭景东;沈晓军;魏凌;陈松乐 | 申请(专利权)人: | 南京联创科技股份有限公司 |
主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06F9/46;G06F17/30 |
代理公司: | 南京天翼专利代理有限责任公司 | 代理人: | 汤志武;王鹏翔 |
地址: | 210013江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 海量数据处理中多线程工作包并行的ETL方法,对大量企业数据进行处理时采用的数据抽取、转换和装载,设有一系列相互衔接、自动进行的业务活动或任务的工作流,工作流遵循路由、规则和任务或操作;其中路由:定义对象及其传送所通过的路径;规则:定义信息的路由及路由隶属;规则包括流向控制条件与异常情况处理;任务或操作:定义工作流在面向某种状态、某种事务或某一工作组的具体操作;将调度对象分为任务、子任务、工作包三个级别,工作包是可调度的最小单位。每个工作包是各种具体操作的集合,工作包的功能由其中的具体操作完成;工作包有输入数据结构和输出数据结构,每个数据结构可具体定义数据项。 | ||
搜索关键词: | 海量 数据处理 多线程 工作 并行 etl 技术 | ||
【主权项】:
1、海量数据处理中多线程工作包并行的ETL方法,对大量企业数据进行处理时采用的数据抽取、转换和装载,其特征是设有一系列相互衔接、自动进行的业务活动或任务的工作流,工作流遵循路由、规则和任务或操作;其中路由:定义对象及其传送所通过的路径;规则:定义信息的路由及路由隶属。规则包括流向控制条件与异常情况处理;任务或操作:定义工作流在面向某种状态、某种事务或某一工作组的具体操作;将调度对象分为任务、子任务、工作包三个级别,工作包是可调度的最小单位。每个工作包是各种具体操作的集合,工作包的功能由其中的具体操作完成;工作包有输入数据结构和输出数据结构,每个数据结构可具体定义数据项,工作包中各项操作是对输入数据结构的数据项进行操作,输出为输出数据结构数据项;一个子任务中的工作包之间可以有关联,工作包可以有前置工作包和后续工作包,任务又包括了子任务的集合与关联;每个任务对应一个线程,通过多线程的并发运行,从而实现了多任务可以同时运行,同时每个任务中的子任务、工作包等可以根据预先设定的条件自行运行;数据结构中包含对每个数据项的具体描述,包括数据项名、数据项类型、数据项序号;每个工作包都有一个输入数据结构和输出数据结构,工作包的所有操作都是对输入数据结构的数据项的操作,然后形成工作包输出数据结构的数据项,对工作包的操作为对数据结构的转换:将输入数据结构转换为输出数据结构。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京联创科技股份有限公司,未经南京联创科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200610106551.1/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理