[发明专利]一种基于深度强化学习的按摩机械手训练方法有效
申请号: | 201811261282.5 | 申请日: | 2018-10-26 |
公开(公告)号: | CN109291052B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 范一诺;王翔宇;丁萌;任晓惠;汪浩;陆佃杰;张桂娟 | 申请(专利权)人: | 山东师范大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;B25J11/00;G16H40/40;G16H40/63 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 赵敏玲 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 按摩 机械手 训练 方法 | ||
1.一种基于深度强化学习的按摩机械手训练方法,其特征在于,通过动作捕捉手套采集数据,动作捕捉手套用于捕捉各手指关节、腕关节处动作数据,采集动作、压力数据,处理所述数据;所述处理数据过程为:将采集的每个动作片段剪辑为设定长度,并将剪辑后的动作片段平均分成若干份;提取动作片段的初始状态值和压力值,将动作值作为参考动作,将压力值归一化后作为参考压力值;构建参考动作集、参考压力集,并设置压力值舒适度范围;
将所述数据、参考动作、参考压力输入神经网络进行预测和决策,执行神经网络输出决策对应的动作值、压力值,并与参考动作、压力值舒适度范围对比;具体地,神经网络输入状态、参考动作、参考压力值、上一步生成的动作,通过奖励、值函数制定策略,每个策略对应一个输出动作,动作产生的状态作为下一个状态继续作为输入;当不满足设定条件时,重复神经网络预测和决策过程;满足设定条件后将训练好的网络与按摩机械手的控制系统相连;所述按摩机械手包括14个指关节、1个腕关节和一个肘关节,指关节和腕关节处安装带有压力传感器的触手。
2.根据权利要求1所述的一种基于深度强化学习的按摩机械手训练方法,其特征在于,所述动作捕捉手套对应于各手指关节、腕关节处安装压力传感器。
3.根据权利要求1所述的一种基于深度强化学习的按摩机械手训练方法,其特征在于,所述压力值舒适度范围由压力传感器多次收集反馈的压力数据得到。
4.根据权利要求1所述的一种基于深度强化学习的按摩机械手训练方法,其特征在于,所述触手为软垫。
5.根据权利要求1所述的一种基于深度强化学习的按摩机械手训练方法,其特征在于,所述神经网络采用卷积神经网络,动作分布用高斯进行建模。
6.根据权利要求1所述的一种基于深度强化学习的按摩机械手训练方法,其特征在于,通过收集按摩机械手的动作、压力数据进行微调。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811261282.5/1.html,转载请声明来源钻瓜专利网。