[发明专利]目标跟踪方法、装置、计算机设备及存储介质有效
申请号: | 202010763146.7 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111890365B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 何敏聪;郜开开;周宸;周宝;陈远旭 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;G06N3/04;G06N3/08;G06T7/246 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 谭果林 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 跟踪 方法 装置 计算机 设备 存储 介质 | ||
1.一种目标跟踪方法,其特征在于,包括:
按照预设采样周期获取实时机械臂状态和包含目标对象的图像序列;
将所述实时机械臂状态和所述包含目标对象的图像序列输入目标对象跟踪模型,获取所述目标对象跟踪模型输出的运动参数,所述目标对象跟踪模型为基于DDPG算法构建的预测模型;
根据所述运动参数控制机械臂的运动状态,以使所述机械臂跟随所述目标对象移动;
所述目标对象跟踪模型包括LSTM和预设演员网络,所述将所述实时机械臂状态和所述包含目标对象的图像序列输入目标对象跟踪模型,获取所述目标对象跟踪模型输出的运动参数,包括:
使用所述LSTM对所述图像序列进行编码,输出第一特征向量;
将所述第一特征向量与所述实时机械臂状态中的关节角度拼接,生成第二特征向量;
将所述第二特征向量输入所述预设演员网络,获取所述预设演员网络输出的所述运动参数;
所述将所述第二特征向量输入所述预设演员网络,获取所述预设演员网络输出的所述运动参数之前,还包括:
获取基于机械臂跟踪训练生成的初始经验数据集,所述初始经验数据集包括当前状态、运行参数、奖励参数和目标状态,所述奖励参数随着指定位置距离的变化而变化,所述指定位置距离为机械臂末端与目标对象的距离;
构建初始演员网络,使用所述初始经验数据集对所述初始演员网络进行预训练,获得预训练模型;
使用所述初始经验数据集初始化DDPG的经验记忆数据库,并使用所述预训练模型初始化DDPG中的待训练演员网络;
初始化完毕后,对所述待训练演员网络进行训练,基于所述待训练演员网络计算出实时运动参数,按照所述实时运动参数控制所述机械臂运动,然后计算出实时奖励参数,在一个所述预设采样周期之后,获取机械臂末端的实时目标状态,并获得在一次训练生成的训练数据,所述训练数据包括实时当前状态、所述实时运动参数、所述奖励参数和所述实时目标状态;
训练完毕后,获得所述预设演员网络,所述预设演员网络为基于所述待训练演员网络训练生成的网络。
2.如权利要求1所述的目标跟踪方法,其特征在于,所述按照预设采样周期获取实时机械臂状态和包含目标对象的图像序列,包括:
通过位置传感器获取所述机械臂的关节角度,所述实时机械臂状态包括所述关节角度;
通过拍摄装置按指定拍摄间隔获取多组包含目标对象的图像,生成所述图像序列,所述拍摄装置设置在预设指定位置。
3.如权利要求2所述的目标跟踪方法,其特征在于,所述预设采样周期处于200ms~1200ms之间;
所述拍摄装置包括至少两个摄像头;
所述预设指定位置为机械臂末端;
所述指定拍摄间隔处于10ms~50ms之间。
4.如权利要求1所述的目标跟踪方法,其特征在于,所述获取基于机械臂跟踪训练生成的初始经验数据集之前,还包括:
通过奖励公式计算所述奖励参数,所述奖励公式包括:
其中,r为奖励参数,e、f、g、h为大于零的超参数,‖v‖为位置误差v的模,‖w‖为角度误差w的模,为速度超限的惩罚项,|Δθi|/为第i个关节的角速度,ωmax i为与第i个关节对应的最大角速度,LT为跟踪结果,其值为0或1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010763146.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种炒菜机
- 下一篇:适用于卫星的贮箱安装结构及卫星