[发明专利]在HIVE中数据迁移方法、装置及终端设备有效
申请号: | 201710432592.8 | 申请日: | 2017-06-09 |
公开(公告)号: | CN107301214B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 陶胜 | 申请(专利权)人: | 广州虎牙信息科技有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 刘延喜;王增鑫 |
地址: | 511442 广东省广州市番禺区南村镇万博二*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | hive 数据 迁移 方法 装置 终端设备 | ||
本发明涉及数据处理领域,具体涉及一种在HIVE中数据迁移方法、装置及终端设备,所述方法包括步骤:将源数据库的数据文件通过Hive映射为源表;判断源表的预设分区是否存在数据记录;当所述源表的预设分区存在数据记录时,获取所述源表的预设分区的所有字段的数据记录;将所述源表的预设分区的数据记录写入目标数据库的目标表的对应分区中。发明通过HIVE将源数据库的数据文件映射为源表,利用HIVE的分区属性通过写查询语言的方式将数据从源表一部分一部分地写入目标表中,以完成源数据库的数据迁移至目标数据库,操作简单,逻辑清晰明了。
【技术领域】
本发明涉及数据处理领域,具体涉及一种在HIVE中数据迁移方法、装置及终端设备。
【背景技术】
在大数据时代,数据格式越来越多种,数据量越来越庞大,有时候需要把数据从一个数据库迁移至另一个数据库,相应地,也就是要把数据从一个表迁移至另外一个表,数据迁移包括迁移和删除操作,目前,数据迁移操作一是由人工手动完成,而人工手动完成费时且麻烦,或是在服务器写shell脚本完成,而利用shell脚本完成所需逻辑复杂也麻烦,因此需要一种新的方案来解决大量数据的迁移问题。
【发明内容】
本发明的目的在于提供一种在HIVE中数据迁移方法,以将大量数据从源表(源数据库)迁移至目标表(目标数据库)中。
为实现该目的,本发明采用如下技术方案:
第一方面,本发明提供一种在HIVE中数据迁移方法,包括如下步骤:
将源数据库的数据文件通过Hive映射为源表;
判断源表的预设分区是否存在数据记录;
当所述源表的预设分区存在数据记录时,获取所述源表的预设分区的所有字段的数据记录;
将所述源表的预设分区的数据记录写入目标数据库的目标表的对应分区中。
进一步的,在所述将所述源表的预设分区的数据记录写入目标数据库的目标表的对应分区中之后,还包括:
判断目标表对应分区的数据记录条数与源表预设分区的数据记录条数是否相同,若相同,删除源表的预设分区的数据记录。
具体的,所述判断源表的预设分区是否存在数据记录,当所述源表的预设分区存在数据记录时的步骤,包括:
利用断言函数判断源表的预设分区是否存在数据记录;
当所述源表的预设分区的数据记录条数大于零时,确定所述源表的预设分区存在数据记录。
优选的,所述判断目标表对应分区的数据记录条数与源表预设分区的数据记录条数是否相同,包括:
利用断言函数判断目标表对应分区的数据记录数与源表预设分区的数据记录数是否相同。
较佳的,在所述断源表的预设分区是否存在数据记录之后,当所述源表的预设分区不存在数据记录时,输出异常信息并停止执行后续操作。
较佳的,在所述判断目标表对应分区的数据记录数与源表预设分区的数据记录数是否相同之后,若不相同,输出异常信息并停止执行后续步骤。
进一步的,所述将所述源表的预设分区的数据记录写入目标数据库的目标表的对应分区中,包括:
将所述源表的预设分区的数据记录进行加工处理,形成加工后的数据记录后写入目标数据库的目标表的对应分区中。
第二方面,本发明还提供一种在HIVE中数据迁移装置,包括:
加载模块:用于将源数据库的数据文件通过Hive映射为源表;
判断模块:用于判断源表的预设分区是否存在数据记录;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙信息科技有限公司,未经广州虎牙信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710432592.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能问答方法及装置
- 下一篇:一种搜索结果缓存方法及装置、搜索方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置