[发明专利]基于容器集群的深度学习任务服务质量保证方法和系统有效
申请号: | 201910672078.0 | 申请日: | 2019-07-24 |
公开(公告)号: | CN110413391B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 钱诗友;邢思凯;曹健;薛广涛;李明禄 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06N3/04;G06N3/08 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 庄文莉 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于容器集群的深度学习任务服务质量保证方法和系统。基于容器的运行平台接收任务,形成任务队列,预测各个任务的所需资源需求,根据所需资源需求对队列中的任务形成优先等级,依据优先等级对任务进行调度;解析任务的运行日志,监控集群资源利用率,基于运行日志和集群资源利用率,判定任务的资源扩展需求,根据资源扩展需求对任务的调度进行修正。本发明易用性高且资源利用率高,用户在提交深度学习任务时只需指定服务质量,无需指定复杂的资源配置,会通过任务调度和任务扩展的方式保证其服务质量;并且充分利用了深度学习任务的特点,用更少的资源保证任务的服务质量。 | ||
搜索关键词: | 基于 容器 集群 深度 学习 任务 服务 质量保证 方法 系统 | ||
【主权项】:
1.一种基于容器集群的深度学习任务服务质量保证方法,其特征在于,包括:调度步骤:基于容器的运行平台接收任务,形成任务队列,预测任务的所需资源需求,根据所需资源需求对任务队列中的任务形成优先等级,依据优先等级对任务进行调度;扩展步骤:解析任务的运行日志,监控集群资源利用率,基于运行日志和集群资源利用率,判定任务的资源扩展需求,根据资源扩展需求对任务的调度进行修正。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910672078.0/,转载请声明来源钻瓜专利网。