[发明专利]一种海量数据自动放置方法和装置在审
申请号: | 201210589489.1 | 申请日: | 2012-12-29 |
公开(公告)号: | CN103049559A | 公开(公告)日: | 2013-04-17 |
发明(设计)人: | 张森林;冯圣中 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 宋鹰武 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 海量 数据 自动 放置 方法 装置 | ||
技术领域
本发明属于互联网通信领域,尤其涉及一种海量数据自动放置方法和装置。
背景技术
随着数据的爆炸式增长,存储与处理海量数据的集群,应运而生。集群通常由多台服务器组成,通过应用软件使得这些服务器协同工作,达到超级计算机的功能。数据的吞吐率,指的是单位时间内处理的数据量,是衡量集群性能的一个重要指标。对于集群来讲,因为存储的数据量很大,因此很有可能在某一时间段内有大量的用户访问数据,数据的吞吐率越高,单位时间内集群能够处理的用户请求就越多,服务质量也就越好。同时,数据的活跃性是不均匀的,即20%的数据是活跃的,而剩余80%的数据是不活跃的,且这种活跃性也是随着时间而变化的,即某一部分数据可能这段时间活跃,但是过了这段时间就不活跃了。因此,在集群中,一段时间内,用户对数据的访问请求可能就集中于个别数据上,而不是平均分散到所有的数据上。
用户请求数据,系统一般需要先找到相关数据,然后进行处理,最后传输给用户。找到相关数据,是磁盘寻址的过程,一般的寻址需要转动磁头,在用户请求多时,很有可能导致磁头频繁移动而造成较大的延迟;数据处理多与内存和CPU相关,不会耗费过多的时间;最耗时间的部分是传输,这与网络带宽有关。由上可知,集群中数据访问时最耗时间的操作,主要磁盘寻址和网络传输,因此只要缩短了这两个过程花费的时间,就会使得数据的平均处理时间减少,而单位时间内集群就能处理更多的数据。缩短磁盘寻址时间,可以使用转速更快的磁盘,或者使用SSD固态硬盘;缩短网络传输时间,可以配置更快的网络。
目前,集群中提高数据吞吐率的方法集中于缩短等待时间,即不能使得某个节点有太多的请求要处理,而其他的请求处于长期的等待状态。通过转移负载的方法,使得数据的访问请求,尽可能并发执行,从而使得整体的等待时间尽可能缩短。实现这种方法的技术是负载均衡,即集群中每个节点上存在的数据量基本相同。但是,这种数据量上的均衡,并不会保证负载的真正均衡,因为数据的活跃性是不均匀的,同一时刻,只有20%的数据处于活跃状态,而剩余80%的数据处于不活跃的状态,处于不活跃的状态,所以考虑将活跃的数据存放在少量硬盘寻址速度快的节点上,使得集群的数据吞吐率大幅提高,而只需增加少许的成本。
发明内容
本发明实施例提供一种海量数据自动放置方法和装置,旨在解决当前负载均衡技术无法使活跃的数据总是存放在少量硬盘寻址速度快的节点上,使得集群的数据吞吐率大幅提高,而不需要增加太多成本。
为此,本发明实施例提供了如下技术方案:
一种海量数据自动放置装置,包括:
服务器配置模块,用于配置高性能服务器;
数据甄别模块,用于根据数据的属性特征,获取活跃数据;
匹配模块,用于判断所述活跃数据是否存在于所述高性能服务器,若不存在,则将所述活跃数据存放于所述高性能服务器。
本发明实施例还提供了一种海量数据自动放置方法,包括:
配置高性能服务器;
根据数据的属性特征,获取活跃数据;
判断所述活跃数据是否存在于所述高性能服务器,若不存在,则将所述活跃数据存放于所述高性能服务器。
与现有技术相比,本发明的实施例具有如下优点:
本发明实施例通过配置高性能服务器,同时根据数据的属性特征,获取活跃数据,然后判断所述活跃数据是否存在于所述高性能服务器,若不存在,则将所述活跃数据存放于所述高性能服务器。将活跃度高的数据存放于性能好的存储节点上,使得集群中的数据访问请求多在这些节点上发生,从而提高了单位时间内处理数据请求的能力,即提高了数据的吞吐率。
附图说明
图1是本发明实施例提供的海量数据自动放置方法的方法流程图;
图2是本发明实施例提供的海量数据自动放置装置的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的海量数据自动放置方法的方法流程图,为了便于说明,仅示出了与本发明实施例相关的部分。
如图1所示,该方法包括以下步骤:
步骤101,配置高性能服务器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210589489.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置