[发明专利]机器人自适应转向单神经元PID控制方法在审

专利信息
申请号: 201610297395.5 申请日: 2016-05-05
公开(公告)号: CN106054598A 公开(公告)日: 2016-10-26
发明(设计)人: 朱诚;焦俊;辜丽川;吴国栋;乔焰;王超;王永梅;许正荣;范国华 申请(专利权)人: 安徽农业大学
主分类号: G05B13/04 分类号: G05B13/04;G05B11/42;G05D1/02
代理公司: 安徽合肥华信知识产权代理有限公司 34112 代理人: 余成俊
地址: 230036 *** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种机器人自适应转向单神经元PID控制方法,首先建立机器人转向系统的转向模型,然后构建RBF神经网络,最后构建PID控制系统。本发明针对机器人转向系统的机械结构及数学模型的特点,设计了基于RBF在线辨识的机器人转向单神经元PID控制,将RBF神经网络与单神经元PID控制相结合应用于非线性的机器人转向系统,既充分利用了RBF神经网络最佳逼近性能的特点和单神经元适应性强的优点,也克服了PID控制中学习算法的不足。
搜索关键词: 机器人 自适应 转向 神经元 pid 控制 方法
【主权项】:
机器人自适应转向单神经元PID控制方法,所述机器人作为移动传感节点,机器人的前两轮为转向轮,后两轮为驱动轮,其特征在于:包括以下步骤:(1)、建立机器人转向系统的转向模型:构建电机转角与转向轮转角的比例系数为1、两相混合式步进电机作为转向器的转向系统,该转向系统包括同轴连接两转向轮的轮轴,轮轴上铰接有一对梯形臂,两梯形臂上端之间铰接有转向横拉杆,步进电机为两相混合步进电机,步进电机与一个转向摇臂传动连接,转向摇臂臂端与一个转向直拉杆铰接,转向直拉杆杆端与一个转向节臂铰接,转向节臂臂端铰接在其中一个梯形臂与轮轴的铰接点;当外部转向控制器发出转向信号时,步进电机通过花键带动转向摇臂旋转,转向摇臂带动转向直拉杆作竖直方向的平动,再带动转向节臂做转动,转向节臂带动梯形臂和左轮转动,同时梯形臂带转动向横拉杆作横行平移,从而带动右侧的转向节臂转动,实现右轮的转向;由于转向系统中转向器选用的是两相混合式步进电机,其传递函数如公式(1)所示:G(S)=θ'/θi              (1),公式(1)中,θ'是步进电机的输出角度,θi代表步进电机的输入角度,经过微分方程推导得转子的运动方程如公式(2)所示:<mrow><mi>J</mi><mfrac><mrow><msup><mi>d</mi><mn>2</mn></msup><mi>&theta;</mi></mrow><mrow><msup><mi>dt</mi><mn>2</mn></msup></mrow></mfrac><mo>+</mo><mi>f</mi><mfrac><mrow><mi>d</mi><mi>&theta;</mi></mrow><mrow><mi>d</mi><mi>t</mi></mrow></mfrac><mo>+</mo><msub><mi>p&phi;</mi><mi>m</mi></msub><msub><mi>i</mi><mi>A</mi></msub><mi>s</mi><mi>i</mi><mi>n</mi><mrow><mo>(</mo><mi>p</mi><mi>&theta;</mi><mo>)</mo></mrow><mo>+</mo><msub><mi>p&phi;</mi><mi>m</mi></msub><msub><mi>i</mi><mi>B</mi></msub><mi>s</mi><mi>i</mi><mi>n</mi><mo>&lsqb;</mo><mi>p</mi><mrow><mo>(</mo><mi>&theta;</mi><mo>-</mo><mi>&lambda;</mi><mo>)</mo></mrow><mo>&rsqb;</mo><mo>=</mo><mn>0</mn><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow><mo>,</mo></mrow>公式(2)中,J是电机或变速机构折合到电机轴上的转动惯量,单位是kg.m;f是电机或变速机构折合到电机轴上的粘性摩擦系数,单位是kg.m.s/rad;是摩擦转矩;λ是极距角;φm是永磁体交链磁通;P是转子齿数;在零初始条件下,当iA=iB=i0,对公式(2)进行拉普拉斯变换,可推导出相应的转向系统传递函数模型如公式(3)所示:<mrow><mtable><mtr><mtd><mrow><mi>G</mi><mrow><mo>(</mo><mi>S</mi><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mi>&theta;</mi><mo>&prime;</mo></msup><msub><mi>&theta;</mi><mi>i</mi></msub></mfrac><mo>=</mo><mfrac><mrow><mn>2</mn><msup><mi>p</mi><mn>2</mn></msup><msub><mi>&phi;</mi><mi>m</mi></msub><msub><mi>I</mi><mn>0</mn></msub></mrow><mrow><msup><mi>Js</mi><mn>2</mn></msup><mo>+</mo><mi>f</mi><mi>s</mi><mo>+</mo><mn>2</mn><msup><mi>p</mi><mn>2</mn></msup><msub><mi>&phi;</mi><mi>m</mi></msub><msub><mi>I</mi><mn>0</mn></msub></mrow></mfrac></mrow></mtd></mtr><mtr><mtd><mrow><mo>=</mo><mfrac><mrow><msup><msub><mi>&omega;</mi><mrow><mi>n</mi><mi>p</mi></mrow></msub><mn>2</mn></msup></mrow><mrow><msup><mi>s</mi><mn>2</mn></msup><mo>+</mo><mn>2</mn><msub><mi>&xi;&omega;</mi><mrow><mi>n</mi><mi>p</mi></mrow></msub><mi>s</mi><mo>+</mo><msup><msub><mi>&omega;</mi><mrow><mi>n</mi><mi>p</mi></mrow></msub><mn>2</mn></msup></mrow></mfrac></mrow></mtd></mtr></mtable><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow><mo>,</mo></mrow>公式(3)中,I0是额定相电流;是无阻尼固有频率;ξ=f/(2Jωnp)是衰减系数;(2)、构建RBF神经网络:RBF神经元网络由输入层、隐含层、输出层三层网络构成,输入层到隐含层权值固定为1,负责信号的传递,隐含层由一组高斯基函数神经元构成,隐含层到输出层之间权值可调,而输出层的激励函数为线性函数,因此输出层是隐含层输出的线性组合;RBF的隐单元按公式(4)输出:<mrow><msub><mi>h</mi><mi>i</mi></msub><mrow><mo>(</mo><msup><mi>x</mi><mi>k</mi></msup><mo>)</mo></mrow><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><mrow><mo>|</mo><mo>|</mo><msup><mi>x</mi><mi>k</mi></msup><mo>-</mo><msub><mi>c</mi><mi>i</mi></msub><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup></mrow><msup><mi>b</mi><mn>2</mn></msup></mfrac><mo>)</mo></mrow><mo>,</mo><mi>i</mi><mo>=</mo><mn>1</mn><mo>,</mo><mn>2</mn><mo>,</mo><mo>...</mo><mo>,</mo><mi>n</mi><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow><mo>,</mo></mrow>公式(4)中,是输入矢量;hi(xk)是第i个隐单元的输出;ci=[ci1,ci2,...cim]是第i个隐单元高斯函数的中心矢量;b=[b1,b2,...,bm]是基宽向量;W=[w1,w2,...,wm]是隐含层到输出层的权向量;||xk‑ci||表示向量xk和ci之间的距离,随着该向量距离的增大hi(xk)的值迅速减小,因此对每一个输入xk,只有中心靠近xk的少数几个隐含层神经元处于激活状态;根据函数逼近原理,RBF网络的输出为隐层节点输出的线性组合,RBF神经网络的输出如公式(5)所示:<mrow><msub><mi>y</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>w</mi><mn>1</mn></msub><msub><mi>h</mi><mn>1</mn></msub><mo>+</mo><msub><mi>w</mi><mn>2</mn></msub><msub><mi>h</mi><mn>2</mn></msub><mo>+</mo><mo>...</mo><mo>+</mo><msub><mi>w</mi><mi>m</mi></msub><msub><mi>h</mi><mi>m</mi></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>w</mi><mi>i</mi></msub><msub><mi>h</mi><mi>i</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow><mo>;</mo></mrow>(3)、构建PID控制系统:基于RBF在线辨识的单神经元PID控制系统主要由SNPID和RBFNNI两部分构成,利用神经网络的非线性函数逼近能力和学习记忆功能,由RBFNNI快速跟踪转向信息的变化,对被控对象信息进行辨识,SNPID利用RBFNNI提供的信息,实时调整PID控制器的参数,达到PID控制器参数的在线自整定,包括以下步骤:(3.1)、设计RBF神经网络辨识器RBFNNI:取x=[u(k),u(k‑1),y(k‑1)]为RBFNNI的输入向量,其中,u(k),y(k)分别为转向系统的控制值和反馈值,逼近误差em=y(k)‑ym(k),性能指标函数选取为:<mrow><msub><mi>J</mi><mi>m</mi></msub><mo>=</mo><mn>0.5</mn><mo>*</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mi>&lambda;</mi><mrow><mi>n</mi><mo>-</mo><mi>k</mi></mrow></msup><msup><msub><mi>e</mi><mi>m</mi></msub><mn>2</mn></msup><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow><mo>,</mo></mrow>根据梯度下降的思想,采用迭代算法确定权节点、节点中心及节点基宽参数,其中学习速率η和动量因子α按照公式(8)实现实时更新:<mrow><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mi>&eta;</mi><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mn>1.2</mn><msub><mi>&eta;</mi><mn>0</mn></msub><mo>,</mo></mrow></mtd><mtd><mrow><msub><mi>J</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>&le;</mo><msub><mi>J</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><mn>0.7</mn><msub><mi>&eta;</mi><mn>0</mn></msub><mo>,</mo></mrow></mtd><mtd><mrow><msub><mi>J</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>&gt;</mo><msub><mi>J</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></mtd></mtr></mtable></mfenced></mrow></mtd></mtr><mtr><mtd><mrow><mi>&alpha;</mi><mo>=</mo><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><mn>2</mn><msub><mi>&alpha;</mi><mn>0</mn></msub><mo>,</mo></mrow></mtd><mtd><mrow><mi>a</mi><mi>b</mi><mi>s</mi><mrow><mo>(</mo><mrow><msub><mi>J</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mo>)</mo></mrow><mo>&le;</mo><mi>&epsiv;</mi></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>&alpha;</mi><mn>0</mn></msub><mo>,</mo></mrow></mtd><mtd><mrow><mi>a</mi><mi>b</mi><mi>s</mi><mrow><mo>(</mo><mrow><msub><mi>J</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mo>)</mo></mrow><mo>&gt;</mo><mi>&epsiv;</mi></mrow></mtd></mtr></mtable></mfenced></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>8</mn><mo>)</mo></mrow><mo>,</mo></mrow>RBFNNI通过对转向系统的在线辨识获取Jacobian辨识信息送往SNPID,以调整单神经元控制器的参数,Jacobian矩阵为,<mrow><mfrac><mrow><mo>&part;</mo><mi>y</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mrow><mo>&part;</mo><mi>u</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow></mfrac><mo>&ap;</mo><mfrac><mrow><mo>&part;</mo><msub><mi>y</mi><mi>m</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mrow><mo>&part;</mo><mi>u</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow></mfrac><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>m</mi></munderover><msub><mi>w</mi><mi>j</mi></msub><msub><mi>h</mi><mi>j</mi></msub><mfrac><mrow><msub><mi>c</mi><mrow><mi>j</mi><mi>i</mi></mrow></msub><mo>-</mo><msub><mi>x</mi><mi>j</mi></msub></mrow><mrow><msup><msub><mi>b</mi><mi>j</mi></msub><mn>2</mn></msup></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>9</mn><mo>)</mo></mrow><mo>;</mo></mrow>(3.2)、设计单神经元PID控制器SNPID:SNPID是将PID控制规律融入神经网络之中的新型控制器,隐含层中含有比例P、积分I、微分D三个单元,该控制器利用RBFNNI提供的Jacobian信息,在线调整PID控制器中kp,ki,kd三个参数,实现PID控制器参数的在线自整定;该控制器实质上为一变系数的比例、积分、微分控制器,学习算法是自适应的,所以本质上是非线性的;自适应性是通过单神经元加权系数wi(k)的调整实现,控制和学习算法如下:设系统输入指令为rin(k),实际输出为y(k),系统的控制误差为e(k)=rin(k)‑y(k)。单神经元的输入为:<mrow><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>xc</mi><mn>1</mn></msub><mo>=</mo><mi>e</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mi>e</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>;</mo></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>xc</mi><mn>2</mn></msub><mo>=</mo><mi>e</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>;</mo></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>xc</mi><mn>3</mn></msub><mo>=</mo><mi>e</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mn>2</mn><mi>e</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>+</mo><mi>e</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>2</mn><mo>)</mo></mrow></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>10</mn><mo>)</mo></mrow><mo>,</mo></mrow>离散控制为:<mrow><mi>u</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mi>u</mi><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>+</mo><mi>K</mi><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mn>3</mn></munderover><msub><mi>w</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><msub><mi>xc</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>11</mn><mo>)</mo></mrow><mo>,</mo></mrow>公式(11)中,K>0为单神经元的比例系数;wi(k)为单神经元网络的权系数,性能指标函数取为:Jc=0.5[rin(k)‑y(k)]2=0.5e2(k)         (12),加权系数的调整量为:<mrow><mtable><mtr><mtd><mrow><msub><mi>&Delta;w</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mo>-</mo><mi>&eta;</mi><mfrac><mrow><mo>&part;</mo><msub><mi>J</mi><mi>c</mi></msub></mrow><mrow><mo>&part;</mo><msub><mi>w</mi><mi>i</mi></msub></mrow></mfrac><mo>=</mo><mo>-</mo><mi>&eta;</mi><mfrac><msub><mi>J</mi><mi>c</mi></msub><mrow><mo>&part;</mo><mi>y</mi></mrow></mfrac><mfrac><mrow><mo>&part;</mo><mi>y</mi></mrow><mrow><mo>&part;</mo><mi>u</mi></mrow></mfrac><mfrac><mrow><mo>&part;</mo><mi>u</mi></mrow><mrow><mo>&part;</mo><msub><mi>w</mi><mi>i</mi></msub></mrow></mfrac></mrow></mtd></mtr><mtr><mtd><mrow><mo>&ap;</mo><mi>&eta;</mi><mi>e</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mfrac><mrow><mo>&part;</mo><msub><mi>y</mi><mi>m</mi></msub></mrow><mrow><mo>&part;</mo><mi>u</mi></mrow></mfrac><msub><mi>xc</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow></mtd></mtr></mtable><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>13</mn><mo>)</mo></mrow><mo>,</mo></mrow>由于所以被控对象的Jacobian信息可以由取代,由此可得调整后的加权系数如公式(14)所示:<mrow><mfenced open = "{" close = ""><mtable><mtr><mtd><mrow><msub><mi>w</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>w</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>+</mo><msub><mi>&eta;</mi><mi>p</mi></msub><mi>e</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mfrac><mrow><mo>&part;</mo><msub><mi>y</mi><mi>m</mi></msub></mrow><mrow><mo>&part;</mo><mi>u</mi></mrow></mfrac><msub><mi>xc</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>w</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>w</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>+</mo><msub><mi>&eta;</mi><mi>i</mi></msub><mi>e</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mfrac><mrow><mo>&part;</mo><msub><mi>y</mi><mi>m</mi></msub></mrow><mrow><mo>&part;</mo><mi>u</mi></mrow></mfrac><msub><mi>xc</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow></mtd></mtr><mtr><mtd><mrow><msub><mi>w</mi><mn>3</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><msub><mi>w</mi><mn>3</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>-</mo><mn>1</mn><mo>)</mo></mrow><mo>+</mo><msub><mi>&eta;</mi><mi>d</mi></msub><mi>e</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mfrac><mrow><mo>&part;</mo><msub><mi>y</mi><mi>m</mi></msub></mrow><mrow><mo>&part;</mo><mi>u</mi></mrow></mfrac><msub><mi>xc</mi><mn>3</mn></msub><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>14</mn><mo>)</mo></mrow><mo>,</mo></mrow>ηpid,分别为比例、积分、微分的学习速率,对不同的权系数分别进行调整。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽农业大学,未经安徽农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610297395.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top