[发明专利]一种基于Cassandra的数据并行处理系统有效

专利信息
申请号: 201310006128.4 申请日: 2013-01-08
公开(公告)号: CN103106249A 公开(公告)日: 2013-05-15
发明(设计)人: 石宣化;金海;吴松;刘炜 申请(专利权)人: 华中科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 华中科技大学专利中心 42201 代理人: 朱仁玲
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 cassandra 数据 并行 处理 系统
【权利要求书】:

1.一种基于Cassandra的数据并行处理系统,包括Hadoop主节点、多个Hadoop子节点以及位于Hadoop子节点上的Cassandra存储端,其特征在于,

主节点包括用户接口模块、Cassandra查询模块、作业调度模块、作业队列模块、作业追踪器;

子节点包括任务追踪器、输入模块、输出模块以及Mapreduce模块;

用户接口模块用于接收用户请求,并判断用户请求的类型是数据查询请求、提交数据处理作业请求还是作业信息查询请求;如果是数据查询请求,则将其发送到Cassandra查询模块,如果是提交数据处理作业请求或作业信息查询请求,则将其发送到作业调度模块;

Cassandra查询模块用于根据接收来自于用户接口模块的数据查询请求在Cassandra系统中进行查询,并将查询的结果返回到用户接口模块;

作业调度模块用于将提交数据处理作业请求对应的作业提交给作业队列模块;

作业调度模块还用于判断该作业信息查询请求对应的作业信息是否为作业追踪器正在处理中的作业信息,若是,则直接将该作业信息返回给用户接口模块,否则在作业队列模块中查询是否存在有对应的作业信息,如果有则将该作业信息返回给用户接口模块,否则查询磁盘的日志文件中是否存在有该作业信息,如果有则将该作业信息返回给用户接口模块,否则返回作业不存在信息给用户接口模块;

作业队列模块用于将来自于作业调度模块的作业添加到其作业队列中,并将作业队列中队首的作业传送到作业追踪器;

作业追踪器用于将来自于作业队列模块的作业拆分成多个子任务,将每个子任务发送到各个子节点的任务追踪器,将存储端中存储的与该作业对应的待处理数据的存储位置信息以及存储端的网络拓扑信息传送到输入模块,并将处理后数据的存储位置信息传送到输出模块;

任务追踪器还用于接收来自主节点的作业追踪器的子任务,并将该子任务发送到Mapreduce模块;

Mapreduce模块用于根据子任务请求输入模块从存储端获取待处理数据;

输入模块用于根据来自作业追踪器的、与该作业对应的待处理数据的存储位置信息以及存储端的网络拓扑信息从存储端获取待处理数据,并将待处理数据发送到Mapreduce模块;

Mapreduce模块还用于对待处理数据进行计算,并将计算结果传送到输出模块;

输出模块用于根据来自于作业追踪器的、处理后数据的存储位置信息将计算结果发送到存储端中的对应位置。

2.根据权利要求1所述的数据并行处理系统,其特征在于,Cassandra查询模块维护一个Cassandra连接池和一个超时连接,当收到一个用户查询请求,首先检查当前超时连接是否超时,若没有超时,则直接使用当前连接向数据库提交查询请求,如果当前连接已超时,则释放当前连接,并从其维护的连接池中请求一个连接作为当前的连接,并使用当前连接向数据库提交查询请求。当向数据库提交数据查询请求之后,其等待数据库返回查询结果,并将查询结果转发给用户接口模块。

3.根据权利要求1所述的数据并行处理系统,其特征在于,作业追踪器正在处理中的作业信息包括作业进度和资源使用率信息。

4.根据权利要求1所述的数据并行处理系统,其特征在于,每个子任务都是由一个map或者reduce任务构成,map和reduce任务执行用户上传的作业包中的map函数和reduce函数,每个map函数处理根据其对应的输入模块的配置,读取存储在本地Cassandra节点的一段数据记录并处理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310006128.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top