[发明专利]一种基于人类演示视频的机器人控制方法、装置和设备在审
申请号: | 201910334554.8 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110070052A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 刘文印;张启翔;陈俊洪;梁达勇;周小静;叶子涵 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;B25J9/16 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 演示 采样图像 计算机可读存储介质 还原 机器人控制 目标机器人 目标动作 视频片段 卷积神经网络 输出结果 物体特征 预设目标 约束条件 预设 机器人 佩戴 采集 发送 检测 培训 | ||
1.一种基于人类演示视频的机器人控制方法,其特征在于,包括:
输入待还原的演示视频和所述演示视频内各个行为操作的起始时间和结束时间;
根据所述各个行为操作的起始时间和结束时间,确定所述各个行为操作对应的视频片段;
在所述各个行为操作对应的视频片段中分别采集多幅采样图像,将所述多幅采样图像输入预先完成训练的预设卷积神经网络中,识别所述各个行为操作对应的目标动作;
将所述多幅采样图像输入至预先完成训练的预设目标检测模型中进行处理,根据所述预设算法模型的输出结果,确定所述各个行为操作对应的物体特征;
根据所述各个行为操作对应的物体特征,确定所述各个行为操作对应的主体和受体;
将所述各个行为操作对应的所述目标动作、所述主体和所述受体发送至目标机器人,以便所述目标机器人还原所述演示视频内的所述各个行为操作。
2.如权利要求1所述的机器人控制方法,其特征在于,所述在所述各个行为操作对应的视频片段中采集多幅采样图像,将所述采样图像输入预先完成训练的预设卷积神经网络中,识别所述各个行为操作对应的目标动作包括:
对所述视频片段的各秒片段分别采集预设数量幅采样图像,将所述采样图像分别输入至预先完成训练的双流卷积神经网络,根据所述双流卷积神经网络的输出结果,确定所述各秒片段的动作结果;
在所述视频各秒片段的动作结果中,查找出现次数最多的动作结果,确定所述视频片段对应的目标动作。
3.如权利要求2所述的机器人控制方法,其特征在于,对所述视频片段的任一秒片段采集预设数量幅采样图像前均包括:
识别所述视频片段中演示者的位置;根据所述演示者的位置设置感兴趣区域,在所述感兴趣区域内采集当前采样图像。
4.如权利要求2所述的机器人控制方法,其特征在于,所述将所述多幅采样图像输入至预先完成训练的预设目标检测模型中进行处理,根据所述预设算法模型的输出结果,确定所述各个行为操作对应的物体特征包括:
将所述多幅采样图像分别输入至预先完成训练的Mask-RCNN模型中,得到每幅采样图像中物体的位置和置信度;
统计所述每幅采样图像的处理结果中每个物体出现的次数和平均置信度,确定所述各个行为操作对应的物体特征。
5.如权利要求1所述的机器人控制方法,其特征在于,所述将所述各个行为操作对应的物体特征,确定所述各个行为操作对应的主体和受体包括:
将所述各个行为操作对应的物体特征分别输入至两个XGBoost模型中,根据所述两个XGBoost模型的输出结果,确定所述各个行为操作对应的主体和受体。
6.一种基于人类演示视频的机器人控制装置,其特征在于,包括:
输入模块,用于输入待还原的演示视频和所述演示视频内各个行为操作的起始时间和结束时间;
第一确定模块,用于根据所述各个行为操作的起始时间和结束时间,确定所述各个行为操作对应的视频片段;
识别模块,用于在所述各个行为操作对应的视频片段中分别采集多幅采样图像,将所述多幅采样图像输入预先完成训练的预设卷积神经网络中,识别所述各个行为操作对应的目标动作;
处理模块,用于将所述多幅采样图像输入至预先完成训练的预设目标检测模型中进行处理,根据所述预设算法模型的输出结果,确定所述各个行为操作对应的物体特征;
第二确定模块,用于根据所述各个行为操作对应的物体特征,确定所述各个行为操作对应的主体和受体;
还原模块,用于将所述各个行为操作对应的所述目标动作、所述主体和所述受体发送至目标机器人,以便所述目标机器人还原所述演示视频内的所述各个行为操作。
7.如权利要求6所述的机器人控制装置,其特征在于,所述识别模块包括:
采样单元,用于对所述视频片段的各秒片段分别采集预设数量幅采样图像,将所述采样图像分别输入至预先完成训练的双流卷积神经网络,根据所述双流卷积神经网络的输出结果,确定所述各秒片段的动作结果;
确定单元,用于在所述视频各秒片段的动作结果中,查找出现次数最多的动作结果,确定所述视频片段对应的目标动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910334554.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:目标检测方法及系统
- 下一篇:一种字体特征提取方法和装置