[发明专利]可视化多数据库ETL集成方法和系统有效
申请号: | 201410086142.4 | 申请日: | 2014-03-10 |
公开(公告)号: | CN104915341B | 公开(公告)日: | 2018-06-26 |
发明(设计)人: | 王巍;宋宏;吕希胜;刘昶;原文斌;姚丽丽 | 申请(专利权)人: | 中国科学院沈阳自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 周秀梅;许宗富 |
地址: | 110016 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标数据库 源数据库 数据库集成 数据库 可视化 连接源 目标表 源表 匹配 数据库管理系统 语义层 优化 | ||
1.可视化多数据库ETL集成方法,其特征在于包括以下步骤:
连接源数据库和目标数据库;通过源数据库和目标数据库的ETL匹配,得到源数据库的源表的SQL语句;
对SQL语句进行优化并执行、得到多个源数据库的ETL数据并注入到目标数据库的目标表;
所述对SQL语句进行优化并执行、得到多个源数据库的ETL数据并注入到目标数据库的目标表包括以下步骤:
处理SQL语句并根据ETL规则库匹配的结果对SQL语句进行优化;
调用平台层提供的API,执行优化后的SQL语句得到ETL数据并存入数据缓冲区,根据ETL规则库将ETL数据注入目标库的目标表;
所述处理SQL语句并根据ETL规则库匹配的结果对SQL语句进行优化包括以下步骤:
将SQL语句建立一个树结构;对树结构的每一节点进行语义检查,并进行结构转换,将分析树转换为表示最初的查询计划的代数操作符树;将代数操作符树转换为执行速度最快的SQL序列。
2.根据权利要求1所述的可视化多数据库ETL集成方法,其特征在于,所述通过源数据库和目标数据库的ETL匹配,得到源数据库的源表的SQL语句包括以下步骤:
配置源数据库和目标数据库及表名、字段,并判断源数据库和目标数据库的数据库类型;
根据源数据库和目标数据库的数据库类型确定不同的ETL规则类,再根据源数据库的源表通过ETL规则类得到源表的SQL语句。
3.可视化多数据库ETL集成系统,其特征在于包括:
数据库管理系统层:连接源数据库和目标数据库;通过源数据库和目标数据库的ETL匹配,得到源数据库的源表的SQL语句;
语义层:对SQL语句进行优化并执行、得到多个源数据库的ETL数据并注入到目标数据库的目标表;
所述语义层包括:
查询编译器:处理SQL语句并根据ETL规则库匹配的结果对SQL语句进行优化;
执行引擎:调用平台层提供的API,执行优化后的SQL语句得到ETL数据并存入数据缓冲区,根据ETL规则库将ETL数据注入目标库的目标表;
所述查询编译器包括:
查询分析器:将SQL语句建立一个树结构;
查询预处理器:对树结构的每一节点进行语义检查,并对树结构的每一节点进行语义检查,并进行结构转换,将分析树转换为表示最初的查询计划的代数操作符树;
查询优化器:将代数操作符树转换为执行速度最快的SOL序列。
4.根据权利要求3所述的可视化多数据库ETL集成系统,其特征在于,所述数据库管理系统层包括:
图形化配置界面:配置源数据库和目标数据库及表名、字段,并判断源数据库和目标数据库的数据库类型;
ETL规则库:根据源数据库和目标数据库的数据库类型确定不同的ETL规则类,再根据源数据库的源表通过ETL规则类得到SQL语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院沈阳自动化研究所,未经中国科学院沈阳自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410086142.4/1.html,转载请声明来源钻瓜专利网。