[发明专利]一种基于Map/Reduce的ETL数据处理方法和装置有效
申请号: | 201610216839.8 | 申请日: | 2016-04-08 |
公开(公告)号: | CN105912636B | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 张洋;胡博 | 申请(专利权)人: | 金蝶软件(中国)有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种基于Map/Reduce的ETL数据处理方法和装置。该方提取各个数据源应用的共性数据,区分各个数据源应用的差异数据,并通过Map/Reduce的并行数据处理能力对各数据源应用的共性数据和差异数据进行过滤清洗,生成预定义格式的数据,然后进行转储。这种发明较之现有的机制,既可以保证各个应用在用户行为收集上的个性化需求,同时将数据转换为预定义格式也保证了对数据分析的需求,并且可以进行高速进行脏数据的清洗,提高了数据处理效率。 | ||
搜索关键词: | 一种 基于 map reduce etl 数据处理 方法 装置 | ||
【主权项】:
一种基于Map/Reduce的ETL数据处理方法,其特征在于,包括:获取各个数据源应用当天上传的原始数据;对所述原始数据进行划分,并从中提取所述各个数据源应用之间的共性数据以及差异数据;基于预设的Map/Reduce架构对所述共性数据和所述差异数据进行ETL处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金蝶软件(中国)有限公司,未经金蝶软件(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610216839.8/,转载请声明来源钻瓜专利网。