[发明专利]一种混合存储介质的数据查询方法和装置有效
申请号: | 201410652564.3 | 申请日: | 2014-11-17 |
公开(公告)号: | CN105608085A | 公开(公告)日: | 2016-05-25 |
发明(设计)人: | 刘诚忠;查锐;杜芳;吴健;冯是聪;吴明辉 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 102218 北京市昌*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 存储 介质 数据 查询 方法 装置 | ||
技术领域
本发明涉及数据存储领域,特别是指一种混合存储介质的数据查询方法和 装置。
背景技术
目前,企业级数据仓库一般采用数据库系统作为底层基础架构。在大数据 背景下,很多企业开始尝试使用Hadoop(分布式计算)之类的新一代数据仓库 技术进行构建。作为数据库和数据仓库领域的通用标准语言SQL(结构化查询 语言),也顺势被移植到了Hadoop上面。最典型也是当前最广泛应用的是 Apache(世界使用排名第一的Web服务器软件)社区的Hive(数据仓库工具)工具, 能够使用类似SQL的语言HiveQL对Hadoop里存储的大量数据进行查询。
在实际应用过程中,客户需要对大量数据进行汇集和转移,而原始数据往 往位于Oracle(甲骨文公司)这样的传统数据库中。一般来讲,客户和项目实 施方会根据数据的逻辑定义去确定数据转移到Hadoop平台中的存储格式,然 后花大量时间进行数据ETL(数据从来源端经过萃取、转置、加载至目的端的 过程)工作。对于TB(万亿字节)级别数据,针对国内普遍数据中心还处于千兆 网的环境前提下,轻则1-2天,重则需要更长的时间甚至数周,而数据在搬运 后还需要各种清洗加工,这对于希望能快速建模,探索大数据价值的公司来说, 无疑是极大的时间成本。
发明内容
本发明要解决的技术问题是,提供一种混合存储介质的数据查询方法和装 置,能够实现统一对混合存储介质上的数据进行查询。
一方面,提供一种混合存储介质的数据查询方法,包括:
获取待查询数据表;
在地址数据库中,获取所述待查询数据表对应的至少一个地址信息,所述 地址信息记录有所述待查询数据表所在的一存储介质以及所述待查询数据表 在所述存储介质中的存储地址;
根据所述地址信息中的所述存储介质以及所述存储地址,在所述存储介质 的所述存储地址处,查找所述待查询数据表。
当所述存储介质为关系数据库时,所述地址信息包括:数据库地址和数据 库名称;
当所述存储介质为HDFS时,所述地址信息包括:节点地址和文件路径。
所述地址信息还包括:端口。
所述的方法,还包括:
根据所述端口,从所述存储介质的所述存储地址处,读取查找的所述待查 询数据表。
所述获取待查询数据表的步骤之前,所述方法还包括:
获取各数据表所在的存储介质以及各数据表在所述存储介质中的存储地 址;
根据所述各数据表所在的存储介质以及各数据表在所述存储介质中的存 储地址,形成各数据表的地址信息;
建立各数据表与所述各数据表的地址信息之间的对应关系。
另一方面,提供一种混合存储介质的数据查询装置,包括:
第一获取模块,获取待查询数据表;
第二获取模块,在地址数据库中,获取所述待查询数据表对应的至少一个 地址信息,所述地址信息记录有所述待查询数据表所在的一存储介质以及所述 待查询数据表在所述存储介质中的存储地址;
查找模块,根据所述地址信息中的所述存储介质以及所述存储地址,在所 述存储介质的所述存储地址处,查找所述待查询数据表。
当所述存储介质为关系数据库时,所述地址信息包括:数据库地址和数据 库名称;
当所述存储介质为HDFS时,所述地址信息包括:节点地址和文件路径。
所述地址信息还包括:端口。
所述的装置,还包括:
读取模块,根据所述端口,从所述存储介质的所述存储地址处,读取查找 的所述待查询数据表。
所述的装置,还包括:
第三获取模块,获取各数据表所在的存储介质以及各数据表在所述存储介 质中的存储地址;
形成模块,根据所述各数据表所在的存储介质以及各数据表在所述存储介 质中的存储地址,形成各数据表的地址信息;
建立模块,建立各数据表与所述各数据表的地址信息之间的对应关系。
本发明的上述技术方案的有益效果如下:
本发明通过对地址信息的建立,所述地址信息记录有所述待查询数据表所 在的一存储介质以及所述待查询数据表在所述存储介质中的存储地址,能够实 现统一对混合存储介质上的数据进行查询。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410652564.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文件存储方法及装置
- 下一篇:一种针对GIS数据的建模方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置