[发明专利]基于Skinner操作条件反射原理的机器人避障导航方法有效

申请号：	201410055115.0	申请日：	2014-02-18
公开（公告）号：	CN103792846A	公开（公告）日：	2014-05-14
发明（设计）人：	阮晓钢;黄静;于乃功;魏若岩;薛坤;张晓平;范青武	申请（专利权）人：	北京工业大学
主分类号：	G05B13/04	分类号：	G05B13/04;G05D1/02
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	张慧
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及了一种基于Skinner操作条件反射原理的机器人避障导航方法。首先，建立机器人的动作集合概率，并令其符合均匀分布；然后，随机选择一个动作，计算相应的位置变化，进而根据与障碍及目标点距离计算出新位置对应的负理想度，并由此得出取向函数值，根据取向函数值按照操作条件反射理论调整动作概率分布，计算系统熵；当系统熵趋于最小值时，选择概率最大动作所指角度前行；重复学习过程，直至抵达目的地。本发明能够很好地模拟人及动物的操作条件反射行为，提高机器人的智能水平，使其具备较强的自学习、自组织、自适应能力，能够在无导师信号的情况下自主探索环境，成功避障导航。
搜索关键词：	基于 skinner 操作条件反射原理机器人导航方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于Skinner操作条件反射原理的机器人避障导航方法，其特征在于将Skinner操作条件反射原理应用于机器人避障导航；所述方法包括以下步骤：步骤1，获得机器人在时刻t的状态及动作集合；在时刻t获得机器人在环境地图中的坐标位置，记作s_i|t＝(x_i,y_i)，以及可能的前进方向用角度表示；动作集合记作A＝{a_k|k＝1,2,…,n_a}，a_k为前进的角度，n_a为动作集大小；令动作集的初始概率分布为均匀分布；步骤2，从动作集中随机选择一动作，即拟选择前行的角度a_k；步骤3，计算状态转移，公式如下：xnew=xold+v*ts*cosθkynew=yold+v*ts*sinθk---(1)]]>式中，x_new、y_new分别代表动作选择后机器人新的横、纵坐标，x_old、y_old分别代表选择前机器人的横、纵坐标；v为机器人移动速度，t_s为机器人传感器采样时间，θ_k表示机器人第k个感知器在以机器人圆心为极点、前进方向为极轴建立的坐标系中所处位置的弧度值；步骤4，计算状态转移前后的负理想度差值；负理想度用于计算取向函数进而反映所感知到的刺激是否为正强化，记作ε＝ε(S)＝{ε(s_i)|i＝1,2,…,n_s}∈R，n_s为机器人状态集大小，用来表征状态s_i远离理想状态的程度，数值越大，则状态s_i相对设定目标越不理想；步骤5，计算取向函数δ值；取向函数δ＝δ(S,A)＝{δ_ik|i＝1,2,…,n_s;k＝1,2,…,n_a}，模拟了自然界中生物的取向性，其中，δ_ik表示状态s_i∈S执行动作a_k∈A后系统性能的变化；和生物取向性概念一致，δ＞0时，为正取向，说明系统性能趋向变好；δ＜0时，为负取向，说明系统性能趋向变差；δ＝0时，为零取向，说明系统性能没有变化；步骤6，根据Skinner操作条件反射理论调整动作集概率分布；动作集概率分布的调整规则为：正强化时，动作概率增加；负强化时，动作概率减少；步骤7，计算t时刻系统熵；系统熵H(t)用来描述系统自组织程度，进而说明模型的自适应性；计算公式为：H(t)=-Σi=1nsp(si)Σk=1nap(ak|si)log2p(ak|si)]]>式中，p(s_i)为机器人处于状态s_i的概率，p(a_k|s_i)为机器人在状态s_i下选择动作a_k的概率；步骤8，判断系统熵是否已趋于最小值H_min，如果是，标志着系统已达到自组织，机器人已形成操作条件反射习得最优动作，则停止本次学习，转下一步；否则，转步骤2；步骤9，从动作集中选择概率最大的动作执行，按公式（1）计算的状态移动机器人，记新状态为机器人当前状态，令各动作概率均匀分布；步骤10，判断机器人当前位置是否为终点，如果是，则结束；否则，转步骤2，进入下一轮学习。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410055115.0/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G05 控制；调节
G05B 一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置
G05B13-00 自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13-02 .电的
G05B13-04 ..包括使用模型或模拟器的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于Skinner操作条件反射原理的机器人避障导航方法有效

专利文献下载