[发明专利]一种基于流量调度的多任务训练集群网络优化方法在审
申请号: | 201910819132.X | 申请日: | 2019-08-31 |
公开(公告)号: | CN112448899A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 孙军欢;胡水海 | 申请(专利权)人: | 深圳致星科技有限公司 |
主分类号: | H04L12/863 | 分类号: | H04L12/863;G06N20/00 |
代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 何姣 |
地址: | 518000 广东省深圳市南山区粤海街道高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 流量 调度 任务 训练 集群 网络 优化 方法 | ||
1.一种基于任务优先级队列的流量调度方法,其特征在于,包括:
构建K个就绪队列,每个队列对应于一个优先级;其中,第一个队列优先级最高,其后队列的优先级以此降低;
将各训练任务的流量根据各自的优先级进入对应的队列,根据优先级高低进行调度:
确定那些尚在训练开始后第I轮迭代以内的任务流量为最高优先级;
将那些在训练开始后第I轮迭代后的任务的流量,根据所述任务在先前全部迭代轮次中的总发送量,分别映射到除最高优先级队列外的其他优先级队列;
其中,K为不小于2的正整数,I为正整数。
2.根据权利要求1所述的流量调度方法,其特征在于,
动态地改变任务优先级:
对于任一任务,当该任务的发送数据量超过预设的阈值后,则降低该任务的优先级。
3.根据权利要求1所述的流量调度方法,其特征在于,
对低优先级中等待时间较长的流量,提高其优先级。
4.一种多任务训练集群网络优化的方法,其特征在于,包括:
获取各训练任务的任务特征,根据任务特征确定其流量优先级:
确定那些尚在训练开始后第I轮迭代以内的任务为最高优先级;
将那些在训练开始后第I轮迭代后的任务,根据所述任务在先前全部迭代轮次中的总发送量,分别确定为除最高优先级外的其他优先级;其中,I为正整数;
根据权利要求1-3任一所述的流量调度方法调度集群各计算节点上各训练任务的流量,控制其流量通信。
5.根据权利要求4所述的多任务训练集群网络优化的方法,其特征在于,
使用高速网络进行参数交换;
并为每个任务分配一个唯一的DSCP,并通过定时地调整DSCP-优先级映射关系,实现流量优先级调度。
6.一种基于任务优先级队列的流量调度模块,其特征在于,包括:
优先级组件,用于获取/接受任务通信优先级;
以及通信队列组件,用于构建K个就绪队列:每个队列对应于一个优先级;其中,第一个队列优先级最高,其后队列的优先级以此降低;其中,K为不小于2的正整数;
根据获取的任务通信优先级,对各任务对应的流量映射到对应的就绪队列中,进行调度通信。
7.根据权利要求6所述的流量调度模块,其特征在于,
动态地改变任务优先级:
对于任一任务,当该任务的发送数据量超过预设的阈值后,则降低该任务的优先级。
8.根据权利要求6所述的流量调度模块,其特征在于,
对低优先级中等待时间较长的流量,提高其优先级。
9.一种基于流调度的多任务训练集群网络系统,其特征在于,包括:
通信管理单元和流量调度单元;其中,
通信管理单元,用于确定任务的通信优先级;所述通信管理单元根据任务特征确定各训练任务的流量优先级:
确定那些尚在训练开始后第I轮迭代以内的任务为最高优先级;
将那些在训练开始后第I轮迭代后的任务,根据所述任务在先前全部迭代轮次中的总发送量,分别确定为除最高优先级外的其他优先级;其中,I为正整数;
流量调度单元,包括权利要求6-8任一所述的流量调度模块,用于获取通信管理单元确定的任务通信优先级,并根据任务通信优先级,调度通信。
10.根据权利要求9所述的多任务训练集群网络系统,其特征在于,
所述系统使用高速网络进行参数交换;
并为每个任务分配一个唯一的DSCP,并通过定时地调整DSCP-优先级映射关系,实现流量优先级调度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳致星科技有限公司,未经深圳致星科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910819132.X/1.html,转载请声明来源钻瓜专利网。