[发明专利]基于Skinner操作条件反射原理的机器人避障导航方法有效
申请号: | 201410055115.0 | 申请日: | 2014-02-18 |
公开(公告)号: | CN103792846A | 公开(公告)日: | 2014-05-14 |
发明(设计)人: | 阮晓钢;黄静;于乃功;魏若岩;薛坤;张晓平;范青武 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04;G05D1/02 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及了一种基于Skinner操作条件反射原理的机器人避障导航方法。首先,建立机器人的动作集合概率,并令其符合均匀分布;然后,随机选择一个动作,计算相应的位置变化,进而根据与障碍及目标点距离计算出新位置对应的负理想度,并由此得出取向函数值,根据取向函数值按照操作条件反射理论调整动作概率分布,计算系统熵;当系统熵趋于最小值时,选择概率最大动作所指角度前行;重复学习过程,直至抵达目的地。本发明能够很好地模拟人及动物的操作条件反射行为,提高机器人的智能水平,使其具备较强的自学习、自组织、自适应能力,能够在无导师信号的情况下自主探索环境,成功避障导航。 | ||
搜索关键词: | 基于 skinner 操作 条件反射 原理 机器人 导航 方法 | ||
【主权项】:
1.一种基于Skinner操作条件反射原理的机器人避障导航方法,其特征在于将Skinner操作条件反射原理应用于机器人避障导航;所述方法包括以下步骤:步骤1,获得机器人在时刻t的状态及动作集合;在时刻t获得机器人在环境地图中的坐标位置,记作si|t=(xi,yi),以及可能的前进方向用角度表示;动作集合记作A={ak|k=1,2,…,na},ak为前进的角度,na为动作集大小;令动作集的初始概率分布为均匀分布;步骤2,从动作集中随机选择一动作,即拟选择前行的角度ak;步骤3,计算状态转移,公式如下:x new = x old + v * t s * cos θ k y new = y old + v * t s * sin θ k - - - ( 1 ) ]]> 式中,xnew、ynew分别代表动作选择后机器人新的横、纵坐标,xold、yold分别代表选择前机器人的横、纵坐标;v为机器人移动速度,ts为机器人传感器采样时间,θk表示机器人第k个感知器在以机器人圆心为极点、前进方向为极轴建立的坐标系中所处位置的弧度值;步骤4,计算状态转移前后的负理想度差值;负理想度用于计算取向函数进而反映所感知到的刺激是否为正强化,记作ε=ε(S)={ε(si)|i=1,2,…,ns}∈R,ns为机器人状态集大小,用来表征状态si远离理想状态的程度,数值越大,则状态si相对设定目标越不理想;步骤5,计算取向函数δ值;取向函数δ=δ(S,A)={δik|i=1,2,…,ns;k=1,2,…,na},模拟了自然界中生物的取向性,其中,δik表示状态si∈S执行动作ak∈A后系统性能的变化;和生物取向性概念一致,δ>0时,为正取向,说明系统性能趋向变好;δ<0时,为负取向,说明系统性能趋向变差;δ=0时,为零取向,说明系统性能没有变化;步骤6,根据Skinner操作条件反射理论调整动作集概率分布;动作集概率分布的调整规则为:正强化时,动作概率增加;负强化时,动作概率减少;步骤7,计算t时刻系统熵;系统熵H(t)用来描述系统自组织程度,进而说明模型的自适应性;计算公式为:H ( t ) = - Σ i = 1 n s p ( s i ) Σ k = 1 n a p ( a k | s i ) lo g 2 p ( a k | s i ) ]]> 式中,p(si)为机器人处于状态si的概率,p(ak|si)为机器人在状态si下选择动作ak的概率;步骤8,判断系统熵是否已趋于最小值Hmin,如果是,标志着系统已达到自组织,机器人已形成操作条件反射习得最优动作,则停止本次学习,转下一步;否则,转步骤2;步骤9,从动作集中选择概率最大的动作执行,按公式(1)计算的状态移动机器人,记新状态为机器人当前状态,令各动作概率均匀分布;步骤10,判断机器人当前位置是否为终点,如果是,则结束;否则,转步骤2,进入下一轮学习。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410055115.0/,转载请声明来源钻瓜专利网。
- 上一篇:汽车控制器处理器监控通信方法
- 下一篇:调色剂组合物