[发明专利]从关系型数据库到HBase数据库的数据流迁移方法在审
申请号: | 201811012560.3 | 申请日: | 2018-08-31 |
公开(公告)号: | CN109299068A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 邓惠元;范联伟;余保华;徐圣吉;刘春珲;李贤军;胡鸿超;金文林;吴婷婷;徐剑;张国林;张金国;展昭;何宽宽;杨培韬 | 申请(专利权)人: | 安徽四创电子股份有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/2455;G06F16/25 |
代理公司: | 合肥和瑞知识产权代理事务所(普通合伙) 34118 | 代理人: | 王挺 |
地址: | 230088 安徽省合肥*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理器 数据库格式 关系型数据库 数据表转换 数据流迁移 数据库 标准关系 可视化操作 数据表存储 创建连接 连接属性 错误率 可控性 全程 服务 | ||
1.一种从关系型数据库到HBase数据库的数据流迁移方法,其特征在于,包括如下步骤:
S1,设置ETL工具的ExecuteSQL处理器的连接属性,将ExecuteSQL处理器与关系型数据库创建连接服务,ExecuteSQL处理器进而查询并获取到关系型数据库中的Avro格式的数据表;
S2,通过ConvertAvroToJSON处理器将所述Avro格式的数据表转换为JSON格式的数据表;
S3,通过ConvertJSONToSQL处理器将Json格式的数据表转换为标准关系型数据库格式的数据表;
S4,通过ReplaceText处理器将标准关系型数据库格式的数据表转换为HBase数据库格式的数据表;
S5,通过PutSQL处理器将HBase数据库格式的数据表存储在HBase数据库中。
2.根据权利要求1所述的一种从关系型数据库到HBase数据库的数据流迁移方法,其特征在于:步骤S1中,ExecuteSQL处理器的连接属性的设置包括对属性Database ConnectionURL、Database Driver Class Name、Database Driver Location(s)、Database User、Password的值的设置;即将属性Database Connection URL的值设置为关系型数据库URL,将属性Database Driver Class Name的值设置为关系型数据库驱动文件的名称,将属性Database Driver Location(s)的值设置为关系型数据库驱动文件的绝对路径,将属性Database User的值设置为访问关系型数据库的用户名,将属性Password的值设置为访问关系型数据库的用户名对应的密码;所述ExecuteSQL处理器的属性的值设置完成后,执行ExecuteSQL处理器,完成ExecuteSQL处理器对所述Avro格式的数据表的查询和获取。
3.根据权利要求2所述的一种从关系型数据库到HBase数据库的数据流迁移方法,其特征在于:步骤S1中,将ExecuteSQL处理器与关系型数据库创建连接服务,即设置ExecuteSQL处理器的参数SQL select query;当参数SQL select query设置为select*from X时,表示ExecuteSQL处理器对参数SQL select query所对应的数据表X进行查询和获取。
4.根据权利要求3所述的一种从关系型数据库到HBase数据库的数据流迁移方法,其特征在于:步骤S1中,还包括对ExecuteSQL处理器进行任务定时调度的设置,即设置参数Maxwait time的值;当参数Max wait time的值设置为t时,表示ExecuteSQL处理器与关系型数据库成功创建连接后,等待t秒执行ExecuteSQL处理器对关系型数据库中的数据表的查询和获取。
5.根据权利要求1所述的一种从关系型数据库到HBase数据库的数据流迁移方法,其特征在于:步骤S2中,将所述Avro格式的数据表转换为JSON格式的数据表包括对ConvertAvroToJSON处理器的属性JSON container options、Wrap single Record的值的设置;属性JSON container options的值表示JSON格式的数据表的表达方式,设置属性JSON container options的值为array,即表示以数组类型的方式表示JSON格式的数据表;属性Wrap single Record的值表示是否以单个记录方式处理数据流,如果是,则属性Wrapsingle Record的值设置为true,如果否,则属性Wrap single Record的值设置为false,此时采用整体打包的方式处理数据流;所述ConvertAvroToJSON处理器的属性的值设置完成后,执行ConvertAvroToJSON处理器,进而完成Avro格式的数据表转换为JSON格式的数据表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽四创电子股份有限公司,未经安徽四创电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811012560.3/1.html,转载请声明来源钻瓜专利网。