[发明专利]一种训练任务排队原因分析方法、系统、设备以及介质有效
申请号: | 202011402706.2 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112463334B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 王文潇 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F18/23;G06F18/214;G06N20/20 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 杨帆;李红萧 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 任务 排队 原因 分析 方法 系统 设备 以及 介质 | ||
1.一种训练任务排队原因分析方法,其特征在于,包括以下步骤:
获取用户输入的训练任务所需的资源以及集群的剩余资源,其中,所需的资源包括cpu、gpu使用量、gpu类型,集群的剩余资源通过平台服务器集群当前cpu负载、gpu负载确定;
启动一个实时监听线程进行任务排队监听,响应于所述剩余资源不满足所述所需的资源,获取聚类模型中预先生成的多个聚类中心数据;
将所述所需的资源和剩余资源作为样本数据并计算与每一个所述聚类中心数据的距离;
将与所述样本数据距离最小的聚类中心数据对应排队原因作为用户输入的训练任务的排队原因进行反馈,其中,每一个聚类中心数据所代表的排队原因是预先进行关联的;
所述方法还包括:
每次判别后将所述样本数据保存自动添加到样本库;
响应于保存的样本数据的数量达到阈值,利用保存的所述样本数据对所述聚类模型进行更新;
利用保存的所述样本数据对所述聚类模型进行更新,进一步包括:
随机生成与排队原因个数相同的多个聚类中心数据;
计算保存的所述样本数据和所述聚类模型中原始的样本数据分别与每一个当前的聚类中心数据的距离以将保存的所述样本数据和所述聚类模型中原始的样本数据划分到对应的聚类中心数据下;
利用每一个聚类中心数据下的样本数据重新计算对应的聚类中心数据;
响应于计算得到的聚类中心数据与当前用于样本数据划分的聚类中心数据不同,则利用计算得到的聚类中心数据再次进行样本数据的划分,以进行迭代训练,直到计算得到的聚类中心数据与当前用于样本数据划分的聚类中心数据相同;
其中,将所述所需的资源和剩余资源作为样本数据,进一步包括:gpu类型无法用具体的数值表示,需要对其进行量化处理,通过标签或编号对不同类型的gpu进行区分。
2.一种训练任务排队原因分析系统,其特征在于,包括:
获取模块,所述获取模块配置为获取用户输入的训练任务所需的资源以及集群的剩余资源,其中,所需的资源包括cpu、gpu使用量、gpu类型,集群的剩余资源通过平台服务器集群当前cpu负载、gpu负载确定;
判断模块,所述判断模块配置为启动一个实时监听线程进行任务排队监听,响应于所述剩余资源不满足所述所需的资源,获取聚类模型中预先生成的多个聚类中心数据;
计算模块,所述计算模块配置为将所述所需的资源和剩余资源作为样本数据并计算与每一个所述聚类中心数据的距离;
反馈模块,所述反馈模块配置为将与所述样本数据距离最小的聚类中心数据对应的排队原因作为用户输入的训练任务的排队原因进行反馈,其中,每一个聚类中心数据所代表的排队原因是预先进行关联的;
所述系统还包括更新模块,所述更新模块配置为:
每次判别后将所述样本数据保存自动添加到样本库;
响应于保存的样本数据的数量达到阈值,利用保存的所述样本数据对所述聚类模型进行更新;
所述更新模块还配置为:
随机生成与排队原因个数相同的多个聚类中心数据;
计算保存的所述样本数据和所述聚类模型中原始的样本数据分别与每一个当前的聚类中心数据的距离以将保存的所述样本数据和所述聚类模型中原始的样本数据划分到对应的聚类中心数据下;
利用每一个聚类中心数据下的样本数据重新计算对应的聚类中心数据;
响应于计算得到的聚类中心数据与当前用于样本数据划分的聚类中心数据不同,则利用计算得到的聚类中心数据再次进行样本数据的划分,以进行迭代训练,直到计算得到的聚类中心数据与当前用于样本数据划分的聚类中心数据相同;
所述计算模块还配置为:gpu类型无法用具体的数值表示,需要对其进行量化处理,通过标签或编号对不同类型的gpu进行区分。
3.一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行如权利要求1所述的方法的步骤。
4.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如权利要求1所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011402706.2/1.html,转载请声明来源钻瓜专利网。