[发明专利]一种多智能体强化学习调度方法、系统及电子设备有效
申请号: | 201910193429.X | 申请日: | 2019-03-14 |
公开(公告)号: | CN109947567B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 任宏帅;王洋;须成忠 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/48;G06N3/04;G06N3/08 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 吴乃壮 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及一种多智能体强化学习调度方法、系统及电子设备。所述方法包括:步骤a:收集网络数据中心的服务器参数以及每台服务器上运行的虚拟机负载信息;步骤b:使用所述服务器参数和虚拟机负载信息建立虚拟仿真环境,并建立多智能体的深度强化学习模型;步骤c:利用所述多智能体的深度强化学习模型和模拟环境进行离线训练和学习,为每个服务器分别训练一个智能体模型;步骤d:将所述智能体模型部署到真实的服务节点,并根据各个服务节点的负载情况进行调度。本申请通过虚拟化技术将服务器上运行的服务虚拟化,通过调度虚拟机的方式来进行负载均衡,资源分配更加宏观,可以实现多智能体在复杂的动态环境下产生协作的策略。 | ||
搜索关键词: | 一种 智能 强化 学习 调度 方法 系统 电子设备 | ||
【主权项】:
1.一种多智能体强化学习调度方法,其特征在于,包括以下步骤:步骤a:收集网络数据中心的服务器参数以及每台服务器上运行的虚拟机负载信息;步骤b:使用所述服务器参数和虚拟机负载信息建立虚拟仿真环境,并建立多智能体的深度强化学习模型;步骤c:利用所述多智能体的深度强化学习模型和模拟环境进行离线训练和学习,为每个服务器分别训练一个智能体模型;步骤d:将所述智能体模型部署到真实的服务节点,并根据各个服务节点的负载情况进行调度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910193429.X/,转载请声明来源钻瓜专利网。