[发明专利]一种基于经验控制的多参数机器人实时行为校正方法有效
申请号: | 201811063090.3 | 申请日: | 2018-09-12 |
公开(公告)号: | CN109249393B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 毛新军;黄裕泓;杨硕;刘哲 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 经验 控制 参数 机器人 实时 行为 校正 方法 | ||
本发明公开了一种基于经验控制的多参数机器人实时行为校正方法,其包括:基于迭代仿真采集的多组状态信息,通过离线学习的方式生成机器人的参数化控制函数;基于离线学习的参数化函数,构建机器人实时运行过程中的自适应调整模型,利用模型对机器人的偏差行为进行校正;根据外部环境变化,自主地从多个控制参数中选择最为敏感的参数控制机器人的行为更新选择。本发明具有较高稳定性、高效率、高适应能力以及鲁棒性等优点。
技术领域
本发明主要涉及到智能机器人控制领域,特指一种基于经验控制的多参数机器人实时行为校正方法。
背景技术
自动控制是机器人最重要的主题之一。通过自主控制,例如具有自适应的模型,机器人可以在无人类参与的条件下适应环境多样化。目前,自适应的主题和挑战是适应性问题的不确定性以及如何克服这种不确定性。其中一个机器人领域中具有代表性的自适应问题就是Path Following问题。
如果没有精确的Path Following,机器人运动的后果将变得不可预测,特别是在无人驾驶领域。这样的后果将导致机器人继续工作的困难。值得注意的是,包括环境中的不确定性,控制器中时效性差和决策模型不完整等在内的Path Following挑战将影响机器人的行为并导致偏差。为了使机器人按预期目标运行,应该减小偏差的影响,并且纠正机器人的行为。
迄今为止,很多机器人的控制都是基于参数化模型。在这种方法中,机器人可以通过从参数化模型中实时更新机器人的行为并部分适应环境多样性来实现Path Following。然而,参数模型很大程度上依赖于人类设计师的经验和专业知识。由于人类不可能完全了解环境,所以当机器人工作空间难以准确建模时,环境中的不确定性会被放大。为了减少参数模型中不确定性的影响,Policy Search,如损伤快速恢复或Self-Optimization的机器学习方法,被开发使用。Policy Search可以通过机器人行为优化很好地处理环境不确定性,但是这个过程需要消耗大量的计算时间。幸运的是,Grady Williams等人使得使用强化学习(Reinforcement Learning,RL)在模糊环境中快速运行四轮车成为可能。这种方法在使用基于时间片的预测的实时控制方面表现良好,但是其基于神经网络的代价开销大并且很难将其他任务嵌入到机器人中。更重要的是,机器人控制中的大部分机器学习方法都基于单参数,因为难以同时调整不同的参数。因此,设计了一种用于多参数机器控制的低成本机器学习智能方法是富有意义的。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种具有较高稳定性、高效率、高适应能力以及鲁棒性的基于经验控制的多参数机器人实时行为校正方法。
为解决上述技术问题,本发明采用以下技术方案:
一种基于经验控制的多参数机器人实时行为校正方法,其包括:
基于迭代仿真采集的多组状态信息,通过离线学习的方式生成机器人的参数化控制函数;
基于离线学习的参数化函数,构建机器人实时运行过程中的自适应调整模型,利用模型对机器人的偏差行为进行校正;
根据外部环境变化,自主地从多个控制参数中选择最为敏感的参数控制机器人的行为更新选择。
作为本发明的进一步改进:采用离线学习的方式生成机器人的参数化控制函数,参数模型函数将由经验数据离线生成;机器人以不同参数迭代运行,以收集机器人状态信息作为数据集的经验数据;借助经验数据,将函数拟合应用于提取数据集中参数之间的潜在规则以及来它们的影响,然后为每个参数创建模型函数。
作为本发明的进一步改进:包括实时对机器人行为进行自适应调整,机器人的行为根据实时机器人状态信息进行自适应调整;传感器监视器使用传感器收集状态信息并确定如何更新机器人的参数;之后,机器人使用离线学习的参数模型函数来调整多个参数;如果机器人行为产生不可接受的偏差,机器人的行为将会改变否则将维持原有控制参数模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811063090.3/2.html,转载请声明来源钻瓜专利网。