[发明专利]一种资源配置方法、装置、设备及可读存储介质在审
申请号: | 202210763773.X | 申请日: | 2022-06-30 |
公开(公告)号: | CN115114026A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 王超 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/455 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 耿苑 |
地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 资源配置 方法 装置 设备 可读 存储 介质 | ||
本申请公开了一种资源配置方法、装置、设备及可读存储介质,该方法包括:Kubernetes获取目标服务的资源状态参数;利用bandit算法,对资源状态参数进行计算,得到资源分配信息;利用资源分配信息,对目标服务进行资源分配。在本申请中,获取目标访问的资源状态参数,然后直接利用bandit算法,计算出目标服务对应的资源分配信息,然后利用该资源分配信息对目标服务进行资源分配即可。由于bandit算法可以实现在线优化,也可以快速响应,因而基于bandit算法计算出的资源分配信息进行资源配置,可以积极应当在线推理服务的冷启动的情况,在线业务特征维度升高、降低导致的计算复杂度变化的情况。
技术领域
本申请涉及计算机应用技术领域,特别是涉及一种资源配置方法、装置、设备及可读存储介质。
背景技术
Kubernetes简称“k8s”或者“kube”,是一个可移植的、可扩展的开源平台,用于管理容器化的工作负载和服务,可促进声明式配置和自动化,可以在物理或虚拟机的Kubernetes集群上运行容器化应用,Kubernetes能提供一个以容器为中心的基础架构,满足在生产环境中运行应用的一些常见需求。
Kubernetes对容器/服务提供了弹性扩容能力,能根据一定的弹性策略动态增加和减少服务的容器节点数,从而动态地调整服务处理能力。在一定程度上解决了突发流量和计算资源分配的问题。
但是,对于在线推理服务的冷启动的情况,或者在线业务特征维度升高、降低导致的计算复杂度变化,现有Kubernetes弹性扩容能力无法快速、准确地为新上线业务提供最佳的计算资源初始化配置,并且对于需要GPU的计算加速场景,Kubernetes也很难有效地根据线上个服务、资源指标进行服务副本的弹性扩缩容。
综上所述,如何有效地解决服务资源配置等问题,是目前本领域技术人员急需解决的技术问题。
发明内容
本申请的目的是提供一种资源配置方法、装置、设备及可读存储介质,以面对资源需求变化的情况下,快速完成与资源需求对应的资源配置。
为解决上述技术问题,本申请提供如下技术方案:
一种服务资源配置方法,包括:
Kubernetes获取目标服务的资源状态参数;
利用bandit算法,对所述资源状态参数进行计算,得到资源分配信息;
利用所述资源分配信息,对所述目标服务进行资源分配。
优选地,所述得到资源分配信息之后,还包括:
利用所述资源分配信息,对与所述目标服务的相似服务进行初始化资源配置。
优选地,所述获取目标服务的资源状态参数,包括:
获取所述目标服务的实时流量、处理器使用率、存储设备占用率、计算设备温度、加速卡计算能力值。
优选地,利用所述资源分配信息,对所述目标服务进行资源分配,包括:
参照所述资源分配信息,对所述目标服务的CPU核心数量、加速卡数量、QPS、资源阈值进行设置或调整。
优选地,利用bandit算法,对所述资源状态参数进行计算,得到资源分配信息,包括:
利用LinUCB算法,对所述资源状态参数进行计算,得到所述资源分配信息。
优选地,在对所述目标服务进行资源分配之后,还包括:
重新获取所述目标服务的资源状态参数;
利用新获取的所述资源状态参数,对所述LinUCB算法的进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210763773.X/2.html,转载请声明来源钻瓜专利网。