[发明专利]基于文件的海量数据处理方法有效
申请号: | 201010265079.2 | 申请日: | 2010-08-29 |
公开(公告)号: | CN101916296A | 公开(公告)日: | 2010-12-15 |
发明(设计)人: | 袁洁 | 申请(专利权)人: | 武汉天喻信息产业股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430223 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文件 海量 数据处理 方法 | ||
1.一种基于文件的海量数据的处理方法,将数据处理系统接收到的海量数据进行文件分组,再分配给多线程并发处理,之后存入数据库中,其中,所述数据处理系统包括多台数据处理服务器和一个共享磁盘柜,所述共享磁盘柜用于存放待处理的数据文件,并提供给所述多台数据处理服务器共享,所述具体处理过程包括:
(1)对多台数据处理服务器间进行互斥控制,保持所述数据处理系统只有一台在处理数据,其他数据处理服务器作为备份;
(2)对海量数据文件进行分组
将海量数据文件根据并发线程的总数量进行分组,再将分组后的文件对应到不同的线程进行处理。
2.根据权利要求1所述的一种基于文件的海量数据的处理方法,其特征在于,所述的互斥控制具体为:
由数据处理服务器的主控进程查询并锁定数据库中的时间控制表,当到达文件处理时间时,主控进程启动处理线程进行文件处理,同时根据处理周期更新下一次的处理时间;
同时,主控进程根据文件处理的进度,在达到下一个处理时间之前,如果文件没有处理完成,主控进程根据运算量的需要,将下一个处理时间往后延长一定的时间。
3.根据权利要求1或2所述的一种基于文件的海量数据的处理方法,其特征在于,所述的海量数据文件的分组具体为:
首先,将文件进行有序的排列并从1开始顺序编号,再将各文件编号对线程的总数量取模,取模后的余数与线程的编号进行对比,如果余数等于其中线程的编号,则将对应的文件交由该线程处理,实现多个线程同时处理分组后的各文件,且各线程处理的文件各不相同。
4.根据权利要求1-3之一所述的一种基于文件的海量数据的处理方法,其特征在于,其特征在于,所述的多台数据处理服务器均与数据库服务器相连接,用于将处理后的数据存入数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉天喻信息产业股份有限公司,未经武汉天喻信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010265079.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光源控制系统及其控制方法
- 下一篇:碳纤维石英加热管