[发明专利]批量调度系统及方法有效
申请号: | 201110391457.6 | 申请日: | 2011-11-30 |
公开(公告)号: | CN102393822A | 公开(公告)日: | 2012-03-28 |
发明(设计)人: | 邹长龙;邹帮山;鲁志彬;王凯 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F9/46 | 分类号: | G06F9/46;G06Q40/04 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 批量 调度 系统 方法 | ||
技术领域
本发明涉及批量数据处理技术领域,具体涉及一种提升运算处理效率、有效利用系统资源实现批量处理的系统及方法。
背景技术
在大型的在线交易系统中,总是存在大量的批量作业。一般而言,批量作业的处理模式主要有两种:
一是采取联机实时处理的方式,也就是常说的联机小批量。该种方法时效性很高,但是联机小批量方式在以联机方式处理批量任务时,并不判断数据处理系统的忙闲,实时上送实时处理,由于批量任务中任务密集度高,将迅速占用大量的系统资源,给系统带来极大的压力,导致整个系统处理速度降低,甚至存在宕机风险;而且批量任务处理一般会集中使用某一个或某几个用户数据,所用用户数据被长时间锁住,使得客户的在线联机任务需要等待数据锁定的解除,导致影响客户联机任务。
另外一种批量任务处理方式是采取按照场次定时处理的方式,一般安排在业务量较小的固定时段按照批量场次集中处理,如早晨、中午、晚间等。
对于该种方式,传统上是将批量中不同数据加工、统计任务按照固定的顺序依次执行,每增加一个新的处理需求,就编写一个新的任务,加在后面,或者干脆直接修改某一任务的处理程序,增加新的处理代码。同时,为了提高资源的使用率,对于每个任务,按照数据分区条件(如地区、国家、产品分类等)并发执行。但是固定的任务顺序会因个别任务导致执行时间过长,或因为一个任务出错影响整个批量执行;而分区划分也比较固定,各分区执行时间长短差距较大,执行中存在等待,时间资源、系统资源得不到充分利用。针对传统处理方式,专利号为ZL200610126976.9、发明名称为“一种批量任务调度引擎和调度方法”提出了一种调度方法:对当前场次的批量任务进行静态特征分析,以获得用参数表示的各个任务的单体特征和任务之间的依赖关系;基于各个任务之间的依赖关系对任务进行分组;根据各个任务的权值,计算各组任务的组权值,其中组权值确定主调度顺序;根据分区权值,确定组内各分区的调度顺序的副调度顺序;基于所述主调度顺序和所述副调度顺序,形成当前场次的批量任务的调度策略;以及利用所述调度策略,执行当前场次的批量任务的调度。通过该方法,使批量处理任务实现任务、分区两维度并发,对固定时段的批量场次内时间资源和硬件资源集约化利用,提升了批量处理的灵活性、可维护性和容错能力。
但是该专利的方法仍是将批量任务安排在固定时段的批量场次中执行,存在如下不足:首先是处理不及时,很难满足时效性要求较高的业务要求。此外,随着批量任务的迅速增加,在固定时段内已很难或无法完成当天的全部批量任务;与之相对应的,在非批量场次的时段内,系统资源有时存在空闲,并没有得到充分利用。如果可以打破固定时段批量场次,不仅可以大幅增加批量处理时间,还可以使数据处理系统资源得到充分利用。
发明内容
为了克服现有技术的上述问题,本发明提出了一种批量调度系统和方法。
本发明的批量调度系统包括:参数设置装置,用户通过该装置设置系统参数和任务处理相关参数,并将设置的参数存储到数据存储装置中;预处理装置,用于对批量任务进行预处理,并将处理后产生的任务输出到数据存储装置中;调度引擎装置,用于定时侦测系统当前并发处理任务量,计算系统可分配的处理各渠道上送批量任务的线程数,并将结果输出给任务处理装置;任务处理装置,用于接收从调度引擎装置传输过来的批量任务处理线程数,调整内部线程,根据任务优先次序参数,读取经过预处理后的任务,进行任务处理;数据存储装置,用于接收并存储参数设置装置设置或计算得到的参数、各渠道上送的批量任务以及预处理装置生成的任务和任务处理日志。
其中,上述系统还包括任务数据分析装置,用于记录与任务量相关的信息,计算某一时段内的渠道特征值和时点特征值,并将计算结果存储在数据存储装置中。
其中,调度引擎装置根据从数据存储装置中获取系统最大并发处理任务量、当前时段的渠道特征值和时点特征值,计算可分配的处理各渠道上送批量任务的线程数。
其中,所述调度引擎装置进一步包括:任务量侦测单元,按照预先设定的时间间隔,定时获取所述系统当前并发处理任务量N,输出给调度决策单元,其中N是自然数;调度决策单元,从系统参数设置单元读取系统最大并发处理任务量M,计算M是否大于N,如果大于,则计算当前时段系统能够分配给各渠道上传的批量任务的处理线程数T,其中M和T为自然数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110391457.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有改进的活塞导引件的农业打包机
- 下一篇:背框以及背光系统