[发明专利]一种基于并行强化学习的云机器人任务调度方法和系统在审
申请号: | 201811298028.2 | 申请日: | 2018-11-02 |
公开(公告)号: | CN109669452A | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 唐恒亮;薛菲;刘涛;董晨刚 | 申请(专利权)人: | 北京物资学院 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 郭智 |
地址: | 101149 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种基于并行强化学习的云机器人任务调度方法和系统,该方法包括:调度中心加载原始问题,并且将所述原始问题分割为多个子问题;所述调度中心将所述多个子问题与多个计算节点进行匹配;所述调度中心将各子问题发送到与其匹配的计算节点;所述多个计算节点对多个子问题进行并行的强化学习,并将对所述多个子问题的学习结果反馈给所述调度中心;所述调度中心根据对该多个子问题的学习结果和预设的收敛条件,判断所述原始问题是否已经收敛,如果所述原始问题已经收敛,则输出所述原始问题的最优策略。该方法可得到精确的最优策略,并且减少时间开销。 | ||
搜索关键词: | 调度中心 原始问题 计算节点 强化学习 并行 任务调度 学习结果 最优策略 匹配 机器人 收敛 时间开销 收敛条件 子问题 加载 预设 反馈 输出 分割 | ||
【主权项】:
1.一种基于并行强化学习的云机器人任务调度方法,其特征在于,包括:调度中心加载原始问题,并且将所述原始问题分割为多个子问题;所述调度中心将所述多个子问题与多个计算节点进行匹配;所述调度中心将各子问题发送到与其匹配的计算节点;所述多个计算节点对多个子问题进行并行的强化学习,并将对所述多个子问题的学习结果反馈给所述调度中心;所述调度中心根据对所述多个子问题的学习结果和预设的收敛条件,判断所述原始问题是否已经收敛,如果所述原始问题已经收敛,则输出所述原始问题的最优策略。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京物资学院,未经北京物资学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811298028.2/,转载请声明来源钻瓜专利网。
- 上一篇:自主驾驶支持设备及方法
- 下一篇:智能平衡车的自动巡检方法