[发明专利]一种计算资源的容错方法、系统、装置及计算机存储介质在审
申请号: | 202210764180.5 | 申请日: | 2022-06-30 |
公开(公告)号: | CN115098547A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 潘燕燕 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/23;G06F9/50;G06Q10/10 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 黄晓燕 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 资源 容错 方法 系统 装置 计算机 存储 介质 | ||
本发明提供了一种计算资源的容错方法、系统、装置及计算机存储介质,容错方法包括响应于用户的任务删除操作,获取当前用户占用的资源配额值Data2;查询数据库中当前用户的资源配额值Data1;比较Data1和Data2,若两者一致,则执行删除任务,释放任务占用的配额,否则,更新数据库中的资源配额值Data2为用户的资源配额值Data1,执行删除任务,释放任务占用的配额。本发明在接收到用户的任务删除操作时,首先对用户及其所在用户组内的实际配额进行采集,并与数据库中存储的资源配置值进行比较,在出现不一致时,将数据库内的数值修改为实际配额值,然后执行任务的删除操作,保证删除任务的顺利进行,从而达到释放资源的目的。
技术领域
本发明涉及资源容错技术领域,尤其是一种计算资源的容错方法、系统、装置及计算机存储介质。
背景技术
AI平台可以对项目用户、用户组进行维护。系统管理员可以在AI平台创建项目用户,用户可以在AI平台进行开发、脚本训练、模型训练。系统管理员可以在AI平台创建用户组,用户组内可以关联用户,关联用户组可以使用的资源组。
AI平台创建用户、用户组,为用户、用户组分配可以使用的资源配额,包括CPU、加速卡等资源的配额。用户在AI平台进行开发、脚本训练、模型训练时,需要占用的CPU、加速卡等资源,这些资源的占用会统计在用户、用户组的已使用配额中,用户、用户组的可以支配的配额减少。如果用户创建的任务占用完所有用户的可以使用的配额时,用户不能再创建新的任务。当用户训练的脚本运行完毕,或者用户删除了未运行完毕的任务时,任务占用的资源配额就会释放,用户、用户组的可以支配的配额增加。
在实际使用时,存在数据集更新错误、任务占用资源未及时刷新、使用者错误更新了数据库等问题,这样会导致任务在运行完成,释放配额后,用户、用户组的已用配额为负值,这样会导致无法删除当前未运行完成的任务,资源无法释放。
发明内容
本发明提供了一种计算资源的容错方法、系统、装置及计算机存储介质,用于解决现有数据库对资源配置的更新错误导致无法删除当前未运行完成的任务,造成资源无法释放的问题。
为实现上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种计算资源的容错方法,所述容错方法包括以下步骤:
响应于用户的任务删除操作,获取当前用户占用的资源配额值Data2;
查询数据库中当前用户的资源配额值Data1;
比较Data1和Data2,若两者一致,则执行删除任务,释放任务占用的配额,否则,更新数据库中的资源配额值Data2为用户的资源配额值Data1,执行删除任务,释放任务占用的配额。
进一步地,所述方法在接收到删除任务之后,执行删除操作之前还包括步骤:
对用户所在用户组的资源进行校验。
进一步地,所述对用户所在用户组的资源进行校验的具体过程为:
获取当前用户所在用户组的资源配额值D3;
查询数据库中当前用户所在用户组的资源配额值D4;
比较D3和D4,若两者不一致,更新数据库中的资源配额D4为用户组的资源配额值D3。
进一步地,所述用户组内包括多个用户,所述资源配额值D3为当前用户组内每个用户下所有任务占用的资源配额值的和。
进一步地,所述资源配额值Data2为当前用户下所有任务占用的资源配额值的和。
进一步地,所述数据库内存储有任务表,任务表中包括每个用户的任务及每个任务占用的资源配额值。
本发明第二方面提供了一种计算资源的容错系统,所述系统包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210764180.5/2.html,转载请声明来源钻瓜专利网。