[发明专利]一种自平衡高空作业台及其控制方法有效
申请号: | 202110515836.5 | 申请日: | 2021-05-12 |
公开(公告)号: | CN113135532B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 赵伟强;马小未;向荣辉 | 申请(专利权)人: | 吉林大学 |
主分类号: | B66F11/04 | 分类号: | B66F11/04;B66C23/66;B66C23/72;F16F15/00;F16H1/32;G06N3/04;G06N3/08;H02H7/08 |
代理公司: | 北京远大卓悦知识产权代理有限公司 11369 | 代理人: | 刘小娇 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 平衡 高空作业 及其 控制 方法 | ||
1.一种自平衡高空作业台的控制方法,其特征在于,
所述自平衡高空作业台包括:
小臂;
驱动电机,其设置在所述小臂一端,位于所述小臂的内部;
行星减速机构,其一端连接所述驱动电机的输出端;
制动机构,其设置在所述驱动电机和所述行星减速机构之间;
作业平台,其与所述行星减速机构的另一端固定连接;
所述自平衡高空作业台的控制方法包括:
通过DDPG网络根据作业平台的位置信息控制驱动电机,使驱动电机带动作业平台进行相应运动,具体包括:
建立并训练DDPG网络,保存训练所得权重参数;
将训练好的DDPG网络移植到运算与控制单元中,对作业平台的位置进行控制;
其中,在训练过程中,DDPG网络根据通过传感器获取作业平台与水平面的夹角信息、作业平台角速度、作业平台载荷,决策出当前动作并执行;
奖励函数针对当前状态给出奖励标量,并通过DDPG网络采集下一时刻的状态信息,得出最优的神经网络权重后进行复制;
所述奖励函数为:
reward=reward1+reward2
其中,
式中,m0,m1为阈值常数,m0=1,m1=1,reward1为第一奖励分量,reward2为第二奖励分量,done为训练结束标志;
当done=1,θ>m0、时,本回合训练终止;
或当前回合步长超过1000时,本回合训练终止,此时,reward2=-100。
2.根据权利要求1所述的自平衡高空作业台的控制方法,其特征在于,所述行星减速机构包括:
太阳轮,其与所述驱动电机的输出端固定连接;
至少两个行星轮,其与所述太阳轮啮合;
行星架,其固定连接所述行星轮;
齿圈,其与所述作业平台固定连接,所述齿圈具有内齿,并与所述行星轮相啮合。
3.根据权利要求2所述的自平衡高空作业台的控制方法,其特征在于,所述行星减速机构为2K-H轮系。
4.根据权利要求3所述的自平衡高空作业台的控制方法,其特征在于,所述减速机构的减速比为13。
5.根据权利要求2所述的自平衡高空作业台的控制方法,其特征在于,所述制动机构包括:
制动器,其设置在所述小臂的内壁上;
制动盘,其固定设置在在所述驱动电机输出轴上。
6.根据权利要求5所述的自平衡高空作业台的控制方法,其特征在于,还包括:
运算与控制单元,其与所述驱动电机、所述制动机构以及所述作业平台电连接。
7.根据权利要求6所述的自平衡高空作业台的控制方法,其特征在于,所述DDPG网络的状态空间St包括:
其中,θ表征作业平台与水平面归一化的夹角关系,θ∈(-1,1];
当θ=0度时,作业平台呈水平姿态;表征作业平台归一化的角加速度量,W表征归一化的动平台载荷,W∈[0,1];θ可由角位移传感器测得;可通过对θ进行微分获得;W可由应变片式压力传感器测得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110515836.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据迁移方法和装置
- 下一篇:分布式集群切换方法、装置及系统