[发明专利]一种基于模型不确定性估计的机械臂强化学习控制方法在审
申请号: | 202310654932.7 | 申请日: | 2023-06-05 |
公开(公告)号: | CN116587278A | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 王英龙;王翻;舒明雷;陈超;狄冲;刘照阳 | 申请(专利权)人: | 山东省人工智能研究院;齐鲁工业大学(山东省科学院) |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 支文彬 |
地址: | 250013*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于模型不确定性估计的机械臂强化学习控制方法,涉及机械臂控制技术领域,考虑到机械臂在建模时存在的不确定性因素,通过不确定性估计来构建机械臂的动力学模型。然后再利用基于机械臂不确定性估计模型的强化学习Dyna‑Q算法,通过与模型的交互产生的数据更新状态模型和奖励函数模型,从模型中获得大量虚拟数据,再利用真实数据与虚拟数据更新价值函数,从而能够高效的产生和利用经验,提高采样效率,选择最佳动作使得机械臂在执行任务中能够获得更优的策略。 | ||
搜索关键词: | 一种 基于 模型 不确定性 估计 机械 强化 学习 控制 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省人工智能研究院;齐鲁工业大学(山东省科学院),未经山东省人工智能研究院;齐鲁工业大学(山东省科学院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310654932.7/,转载请声明来源钻瓜专利网。