[发明专利]基于对抗结构化控制的仿生机器鱼运动控制方法、系统有效
申请号: | 201911199839.1 | 申请日: | 2019-11-29 |
公开(公告)号: | CN110909859B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 吴正兴;喻俊志;闫帅铮;王健;谭民 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06N3/008 | 分类号: | G06N3/008;G06N3/045;G06N3/0464;G06N3/048;G06N3/084;G06N3/086;G06N3/092;G06N3/094;B63C11/52 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对抗 结构 控制 仿生 机器 运动 方法 系统 | ||
本发明属于仿生机器人控制领域,具体涉及了一种基于对抗结构化控制的仿生机器鱼运动控制方法、系统,旨在解决现有仿生鱼控制方法训练难度高、运动效率低、鲁棒性差的问题。本发明包括:以运动至目标点的精度与速度为奖励项,以舵机功率和为损失项,构建优化目标函数;优化产生舵机全局控制量的中枢模式发生器模型的参数,固化其参数后优化舵机补偿控制模型的参数;迭代进行模型的参数优化;通过训练好的模型获取仿生机器鱼全局控制和补偿控制信号,并将两组输出信号的线性组合作为机器鱼舵机的控制信号,实现机器鱼的运动控制。本发明结合全局控制信号与局部补偿控制信号,进行模型对抗训练,训练难度低,仿生机器鱼运动精确、能耗低。
技术领域
本发明属于仿生机器人控制领域,具体涉及了一种基于对抗结构化控制的仿生机器鱼运动控制方法、系统。
背景技术
仿生机器鱼作为一种典型的水下机器人,在科普教育、水文监测、生物运动分析等诸多领域发挥着愈发重要的作用。其中,良好的运动控制能够帮助机器鱼实现水下快速、稳定与节能的游动,更好地完成复杂任务。因此,近年来针对仿生机器鱼的运动优化方法的研究成果层出不穷。
在研究初期,通常针对机器鱼仿生对象的差异建立不同动力学模型来提高机器鱼游动性能,如基于Kane方法的机器鱼波状游动动力学建模[1]等,为机器鱼运动控制研究提供重要理论支撑;利用广义循环神经网络辨识机器鱼游动控制的强非线性关系,并依据此关系对机器鱼稳速直游进行运动优化[2];利用粒子群算法优化中枢模式发生器(CPG,Central Pattern Generator)参数的方法来提高仿生机器鱼正游、倒游游速与稳定性[3]。
除此之外,日趋火热的深度强化学习(DRL,Deep Reinforcement Learning)方法为高维连续控制下的多目标优化问题提供了较好的算法方案,但其应用于真实世界机器人的可行性和准确性备受质疑,仍有待进一步的研究。在DRL算法的实际应用中,Levine等人建立了一个手眼机器人训练的大规模数据采集的案例[4];Ebert等人采用基于自监督模型的方法来教机械臂学习新技能[5];Pong等人将基于模型和非模型的训练方法相结合,提出了学习效率高、性能稳定的时域差分模型[6];Srouji等人研究了利用结构化控制网络提高归纳偏差来提高真实机器人训练中的采样效率[7]。但是对于专注于高机动性运动机制研究的仿生机器鱼来说,数据量缺乏、视觉反馈实时性低以及计算资源的限制使得这些大规模数据采集方法无法充分发挥其优势。同时,利用神经网络训练非线性控制系统的难度较大,实际应用中鲁棒性较差。因此,仿生机器鱼的实际运动控制大多采用传统控制或简单智能控制,如比例-积分-微分控制器(PID)、反步滑膜控制、模糊控制等。
总的来说,现有技术直接采用深度强化学习方法学习仿生机器鱼的非线性控制律,由于数据量缺乏、视觉反馈实时性低以及计算资源的限制,训练难度高,而传统方法中仿生鱼采用的运动控制或简单智能控制,运动效率低、鲁棒性差。
以下文献是与本发明相关的技术背景资料:
[1]夏丹、陈维山、刘军考、韩路辉,基于Kane方法的仿鱼机器人波状游动的动力学建模,机械工程学报,20090615.
[2]郭顺利、朱其新、谢广明,基于GRNN的机器鱼直游稳态速度建模,兵工自动化期刊,20101115.
[3]汪明、喻俊志、谭民,胸鳍推进型机器鱼的CPG控制及实现,机器人期刊,20100315.
[4]Levine S,Pastor P,Krizhevsky A,Ibarz J,Quillen D.Learning hand-eyecoordination for robotic grasping with deep learning and large-scale datacollection[J].The International Journal of Robotics Research,2018,37(4-5):421-436.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911199839.1/2.html,转载请声明来源钻瓜专利网。