[发明专利]基于文件的海量数据处理方法有效

专利信息
申请号: 201010265079.2 申请日: 2010-08-29
公开(公告)号: CN101916296A 公开(公告)日: 2010-12-15
发明(设计)人: 袁洁 申请(专利权)人: 武汉天喻信息产业股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 华中科技大学专利中心 42201 代理人: 朱仁玲
地址: 430223 湖北省武汉*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 文件 海量 数据处理 方法
【权利要求书】:

1.一种基于文件的海量数据的处理方法,将数据处理系统接收到的海量数据进行文件分组,再分配给多线程并发处理,之后存入数据库中,其中,所述数据处理系统包括多台数据处理服务器和一个共享磁盘柜,所述共享磁盘柜用于存放待处理的数据文件,并提供给所述多台数据处理服务器共享,所述具体处理过程包括:

(1)对多台数据处理服务器间进行互斥控制,保持所述数据处理系统只有一台在处理数据,其他数据处理服务器作为备份;

(2)对海量数据文件进行分组

将海量数据文件根据并发线程的总数量进行分组,再将分组后的文件对应到不同的线程进行处理。

2.根据权利要求1所述的一种基于文件的海量数据的处理方法,其特征在于,所述的互斥控制具体为:

由数据处理服务器的主控进程查询并锁定数据库中的时间控制表,当到达文件处理时间时,主控进程启动处理线程进行文件处理,同时根据处理周期更新下一次的处理时间;

同时,主控进程根据文件处理的进度,在达到下一个处理时间之前,如果文件没有处理完成,主控进程根据运算量的需要,将下一个处理时间往后延长一定的时间。

3.根据权利要求1或2所述的一种基于文件的海量数据的处理方法,其特征在于,所述的海量数据文件的分组具体为:

首先,将文件进行有序的排列并从1开始顺序编号,再将各文件编号对线程的总数量取模,取模后的余数与线程的编号进行对比,如果余数等于其中线程的编号,则将对应的文件交由该线程处理,实现多个线程同时处理分组后的各文件,且各线程处理的文件各不相同。

4.根据权利要求1-3之一所述的一种基于文件的海量数据的处理方法,其特征在于,其特征在于,所述的多台数据处理服务器均与数据库服务器相连接,用于将处理后的数据存入数据库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉天喻信息产业股份有限公司,未经武汉天喻信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010265079.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top