[发明专利]一种用于大数据统计分析的增量数据同步的方法有效
申请号: | 201910949695.0 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110727684B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 刘传涛;胡清 | 申请(专利权)人: | 浪潮软件股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/23;G06F16/27 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 271000 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种用于大数据统计分析的增量数据同步的方法,属于大数据中增量数据同步技术领域,本发明利用Apache NiFi从分布式数据库HBase中,以Apache Phoenix作为二级索引,将增量数据通过Spark同步至数据仓库Hive中,实现数据仓库Hive数据以不同分区同步更新的功能,并且不影响Spark+Hive统计分析的性能。 | ||
搜索关键词: | 一种 用于 大数 据统计 分析 增量 数据 同步 方法 | ||
【主权项】:
1.一种用于大数据统计分析的增量数据同步的方法,其特征在于,/n利用Apache NiFi从分布式数据库HBase中,以Apache Phoenix作为二级索引,将增量数据通过Spark同步至数据仓库Hive分区表中,实现数据仓库Hive数据以不同分区同步更新的功能。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件股份有限公司,未经浪潮软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910949695.0/,转载请声明来源钻瓜专利网。