[发明专利]机器人系统的无导数模型学习系统及设计在审
申请号: | 202080067422.4 | 申请日: | 2020-07-29 |
公开(公告)号: | CN114450131A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | D·罗梅雷斯;A·达拉·里贝拉;D·贾;D·N·尼科夫斯基 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;G05B13/02;G06N3/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 原宏宇;刘久亮 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器人 系统 导数 模型 学习 设计 | ||
1.一种用于控制操纵系统的操纵器学习控制设备,所述操纵器学习控制设备包括:
接口,所述接口被配置为接收所述操纵系统的操纵器状态信号和关于要由所述操纵系统在工作空间中操纵的对象的对象状态信号,其中,所述对象状态信号由至少一个对象检测器检测;
输出接口,所述输出接口被配置为向所述操纵系统发送初始策略程序和更新策略程序;
存储器,所述存储器用于存储包括数据预处理程序、对象状态历史数据、操纵器状态历史数据、无导数半参数高斯过程DF-SPGP核学习程序、无导数半参数高斯过程DF-SPGP模型学习程序、更新策略程序和初始策略程序的计算机可执行程序;以及
处理器,所述处理器与所述存储器连接,所述处理器被配置为将所述初始策略程序发送到所述操纵系统以用于启动学习过程,所述学习过程在预设时间段期间操作操纵所述对象的操纵器系统,其中,所述处理器根据所述对象状态历史数据和所述操纵器状态历史数据更新所述DF-SPGP模型学习程序,所述对象状态历史数据和所述操纵器状态历史数据是使用所述数据预处理程序从在所述预设时间段内已经接收到的操纵器状态信号和对象状态信号的集合转换的,其中,所述处理器根据更新的DF-SPGP模型学习程序来对所述更新策略程序进行更新。
2.根据权利要求1所述的操纵器学习控制设备,其中,在已经根据经更新的DF-SPGP模型学习程序对所述更新策略程序进行更新之后,将所述更新策略程序发送到所述操纵系统。
3.根据权利要求1所述的操纵器学习控制设备,其中,所述操纵器状态信号由状态检测器检测,其中,所述状态检测器布置在所述操纵系统的移动部分处或者所述操纵系统的非移动部分处,或者布置在所述操纵系统的所述移动部分和所述非移动部分两者处。
4.根据权利要求3所述的操纵器学习控制设备,其中,所述操纵器状态信号是来自所述操纵系统的致动器或所述操纵系统的编码器的信号,或者是来自所述致动器和所述编码器的信号的组合。
5.根据权利要求3所述的操纵器学习控制设备,其中,所述状态检测器是定位传感器或编码器或者所述定位传感器和所述编码器的组合。
6.根据权利要求1所述的操纵器学习控制设备,其中,所述至少一个对象检测器是生成所述对象状态信号的RGB或RGBD相机。
7.根据权利要求1所述的操纵器学习控制设备,其中,所述对象状态数据表示所述对象在预定时间段内的位置的顺序测量数据的集合。
8.根据权利要求1所述的操纵器学习控制设备,其中,所述至少一个对象检测器与所述操纵系统分离。
9.根据权利要求1所述的操纵器学习控制设备,其中,操纵器的状态检测器布置在所述操纵系统的关节位置处。
10.根据权利要求3所述的操纵器学习控制设备,其中,所述操纵器状态数据表示所述操纵器在预定时间段内的位置的顺序测量数据的集合。
11.根据权利要求1所述的操纵器学习控制设备,其中,所述DF-SPGP模型学习程序预测所述操纵器和/或由所述操纵器操纵的所述对象的行为。
12.根据权利要求7所述的操纵器学习控制设备,其中,所述DF-SPGP核学习程序定义所述DF-SPGP模型学习程序,所述DF-SPGP模型学习程序预测所述操纵器和/或由所述操纵器操纵的所述对象的行为。
13.根据权利要求1所述的操纵器学习控制设备,其中,所述至少一个对象检测器是生成所述对象状态信号的位置编码器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080067422.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理装置、数据处理方法和机器人
- 下一篇:充气轮胎