[发明专利]数据加载装置和数据加载方法有效
申请号: | 201210530406.1 | 申请日: | 2012-12-10 |
公开(公告)号: | CN102938001A | 公开(公告)日: | 2013-02-20 |
发明(设计)人: | 宋怀明;王颖;苗艳超;刘新春;邵宗有 | 申请(专利权)人: | 曙光信息产业(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德恒律治知识产权代理有限公司 11409 | 代理人: | 章社杲;孙征 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 加载 装置 方法 | ||
技术领域
本发明涉及计算机数据处理技术领域,更具体地,涉及一种数据加载装置、数据加载方法和数据库集群系统。
背景技术
在数据库集群系统中,为了提高数据访问的性能,往往采用一定的划分策略将数据表分布到多个数据库节点上。因此在数据写入的时候,必须按照这些数据的划分策略,对数据进行划分并写入到相应的数据库中。常见的数据划分策略可以包括哈希Hash划分、范围Range划分、列表List划分和轮询Round划分。三种数据划分对查询处理和系统实现的比较如表1所示。
表1三种数据划分方式的比较
当需要加载的数据量较大时,通常采用批量加载(Batch)的方式提高数据写入性能,即每次提交一个批次的数据(比如说1000条数据),而不是单条数据库记录的写入操作。批量加载是目前提高数据加载性能的最佳方法,但是在需要使用数据划分策略的情况下,每一批数据首先要进行划分,这在数据库集群系统中的数据库节点数较多时,经常存在以下两个问题:
(1)客户端提交的每批数据被划分后,不同数据库节点的数据量不均衡;
(2)一批数据被划分后,对应到每个数据库节点的数据量较小,难以发挥批量加载的性能优势。
由于上述两个问题的存在,影响了现有数据库集群系统的数据写入的性能。
发明内容
针对现有技术中存在的问题,本发明提供了一种数据加载方法和数据加载装置,使得能够提高数据写入数据库集群系统的性能
根据本发明的一个方面,提供了一种数据加载方法,包括:
将要加载数据按照设置的数据划分策略划分成多个数据部分,并为所述多个数据部分分配不同的数据库节点;
基于为所述多个数据部分分配的数据库节点将所述多个数据部分分别存储到多个本地缓存部分中,其中,所述多个本地缓存部分相互独立且每个本地缓存部分对应一个数据库节点;
检测到所述多个本地缓存部分中的一个本地缓存部分存储的数据量超过第一数据量阈值时,将该本地缓存部分中的数据加载到与该本地缓存部分对应的数据库节点中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210530406.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置