[发明专利]一种对空间目标实施抓捕的方法、装置和存储介质有效
申请号: | 202010526883.5 | 申请日: | 2020-06-11 |
公开(公告)号: | CN111687840B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 张涛;李少朋;王圣杰 | 申请(专利权)人: | 清华大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 郑红娟;宋志强 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 空间 目标 实施 抓捕 方法 装置 存储 介质 | ||
本申请公开了一种对空间目标实施抓捕的方法、装置和存储介质,具体为获取抓捕装置的初始状态信息,初始状态信息包括表示抓捕装置在初始动作状态下的环境状态信息和动作属性信息,将初始状态信息和抓捕装置所要接近的空间目标的位置信息输入预先训练的第一移动状态优化模型,第一移动状态优化模型用于表示抓捕装置的动作属性信息和空间目标的位置信息之间的移动关系,通过第一移动状态优化模型确定抓捕装置的最优移动信息,并按照最优移动信息移动抓捕装置对空间目标进行抓捕。本申请实施例通过训练的第一移动状态优化模型,提升了第一移动状态优化模型对抓捕装置的最优移动信息的表征能力,提升了对空间目标的抓捕效率和准确率。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种对空间目标实施抓捕的方法、装置和存储介质。
背景技术
随着空间技术的不断发展,空间机器人成为研究热点。空间机器人通常是指装有机械臂的服务卫星。机械臂由于其自身具有的灵巧操作性,可以提高服务卫星完成各类复杂空间任务的能力,例如消旋、抓捕、对接、精细操作等。空间机器人在各类任务中的规划与控制因此成为研究的热点问题。空间机器人具有复杂的动力学特性,在自由漂浮时属于非完整系统,其规划与控制问题相较于地面机器人更加复杂。
人工智能能够在一定程度上提高空间机器人的自主性,是空间机器人从人在回路的规划与控制如遥操作过渡到无人参与的自主规划与控制的重要一环,为空间智能的研究提供了理论基础。强化学习是人工智能在机器人领域中的典型应用。强化学习的主要特征是策略搜索,即通过求解目标函数为奖励函数的带有一定约束的非凸优化问题来得到策略的局部最优解。规划与控制作为机器人领域的两大主要问题,虽然评价的指标不尽相同,但大多都可以建模为马尔科夫决策过程,从而在强化学习的框架下求解。深度学习的出现进一步提高了强化学习的处理能力,即深度强化学习,深度强化学习在强化学习的优化框架下,采用深度学习来提取与环境交互得到的经验即样本的特征,大大提高了强化学习的表征能力,使得强化学习在机器人的规划与控制问题中有了更好的应用前景。然而,强化学习在机器人规划与控制问题中的应用面临着计算复杂度高、样本利用率低、样本获取难度高、奖励函数稀疏或不易设计、模型估计存在误差、实时性和准确率都较低等问题,且对可以适用的空间机器人有类型的要求,不具有普适性。
发明内容
本申请实施例提供了一种对空间目标实施抓捕的方法,克服了抓捕装置对空间目标进行抓捕时可能存在的的准确率较低,且实时性较差的问题,提升了抓捕效率。
该方法包括:
获取抓捕装置的初始状态信息,所述初始状态信息包括表示抓捕装置在初始动作状态下的环境状态信息和动作属性信息;
将所述初始状态信息和所述抓捕装置所要接近的空间目标的位置信息输入预先训练的第一移动状态优化模型,其中,所述第一移动状态优化模型用于表示在所述抓捕装置和所述空间目标之间的相对位姿固定时,所述抓捕装置的所述动作属性信息和所述空间目标的所述位置信息之间的移动关系;
通过所述第一移动状态优化模型确定所述抓捕装置的最优移动信息,并按照所述最优移动信息移动所述抓捕装置对所述空间目标进行抓捕。
可选地,获取所述抓捕装置的样本状态信息,所述样本状态信息包括表示抓捕装置在至少一个时刻下的样本环境状态信息和样本动作属性信息;
基于所述抓捕装置在当前时刻下的所述样本动作属性信息和在前一时刻下的所述样本动作属性信息,生成所述抓捕装置在当前时刻的移动关系函数;
基于所述抓捕装置在当前时刻下的所述样本环境状态信息和在前一时刻下的所述样本环境状态信息,生成所述抓捕装置在当前时刻的状态转移函数;
根据所述移动关系函数和所述状态转移函数,确定所述第一移动状态优化模型的第一奖励函数,并基于所述第一奖励函数对所述第一移动状态优化模型进行优化,以完成所述第一移动状态优化模型的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010526883.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:应用于扫地机远程控制方法
- 下一篇:应用于车辆和TBOX终端的绑定方法