[发明专利]生信检测任务分布式调度方法及装置在审
申请号: | 202310096667.5 | 申请日: | 2023-01-17 |
公开(公告)号: | CN116010102A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 杨姣博;湛瑜;贺增泉;王今安;晋向前 | 申请(专利权)人: | 深圳华大医学检验实验室 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/48 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张茵 |
地址: | 518000 广东省深圳市盐田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 任务 分布式 调度 方法 装置 | ||
1.一种生信检测任务分布式调度方法,其特征在于,包括:
确定下机数据匹配的生信检测任务;
对所述生信检测任务进行任务拆分,得到多个子任务;
获取服务器注册表;
根据所述服务器注册表,为每个所述子任务分配服务器,以完成所述生信检测任务。
2.根据权利要求1所述的生信检测任务分布式调度方法,其特征在于,所述确定下机数据匹配的生信检测任务,包括:
获取多个下机数据;
根据所述服务器注册表中每个空闲状态服务器的类型以及每个空闲状态服务器的处理性能,确定各服务器类型间的处理能力比值;
根据所述处理能力比值,为各个服务器类型分配下机数据;
根据每个所述下机数据对应的服务器类型,确定所述下机数据对应的生信检测任务。
3.根据权利要求2所述的生信检测任务分布式调度方法,其特征在于,所述根据每个所述下机数据对应的服务器类型,确定所述下机数据对应的生信检测任务,包括:
根据所述下机数据所包含的内容以及所述下机数据对应的服务器类型,确定与所述下机数据匹配的生信检测任务,其中,下机数据所包含的内容包括物种信息、数据类型、测序深度、测序区域、测序方式、测序平台、数据编号、基因数据名称、接头类型、参考序列、覆盖度、读长、测序类型、GC含量、序列编号以及序列版本号中的任意一种或任意多种。
4.根据权利要求1所述的生信检测任务分布式调度方法,其特征在于,所述生信检测任务中包括多个处理环节;
对所述生信检测任务进行任务拆分,得到多个子任务,包括:
确定所述生信检测任务中每个所述处理环节所需的资源;
依据每个所述处理环节所需的资源以及每个处理环节之间的依赖性,对所述生信检测任务进行任务拆分,得到多个子任务。
5.根据权利要求4所述的生信检测任务分布式调度方法,其特征在于,依据每个所述处理环节所需的资源以及每个处理环节之间的依赖性,对所述生信检测任务进行任务拆分,得到多个子任务,包括:
依据每个所述处理环节所需的计算资源、线程数、内存占用量、存储空间以及每个处理环节之间的依赖性,对所述生信检测任务进行任务拆分,得到多个子任务。
6.根据权利要求1所述的生信检测任务分布式调度方法,其特征在于,根据所述服务器注册表,为每个所述子任务分配服务器,包括:
根据所述服务器注册表,确定所述服务器注册表中各个服务器的处理性能;
根据每个所述子任务在执行过程所需要耗费的资源、以及各个服务器的处理性能,为所述子任务分配服务器。
7.根据权利要求6所述的生信检测任务分布式调度方法,其特征在于,所述服务器注册表中包含各个服务器的空闲状态、响应时间、传输距离、吞吐量以及当前连接数;
根据所述服务器注册表,确定所述服务器注册表中各个服务器的处理性能,包括:
根据每个服务器的空闲状态、响应时间、传输距离、吞吐量、当前连接数,确定所述服务器的处理性能。
8.根据权利要求6所述的生信检测任务分布式调度方法,其特征在于,所述根据每个所述子任务在执行过程所需要耗费的资源、以及各个服务器的处理性能,为所述子任务分配服务器,包括:
根据每个所述子任务在执行过程所需要耗费的资源,从各个服务器中筛选一个以上目标服务器,每个所述目标服务器的处理性能与所述资源相匹配;
根据各个所述目标服务器的处理性能以及当前连接数,对各个目标服务器进行优先级排序,得到排序结果;
根据所述排序结果,为所述子任务分配服务器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大医学检验实验室,未经深圳华大医学检验实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310096667.5/1.html,转载请声明来源钻瓜专利网。