[发明专利]基于发育网络的移动机器人运动方向预先决策方法有效
申请号: | 201910255732.8 | 申请日: | 2019-03-29 |
公开(公告)号: | CN110000781B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 王东署;杨凯;罗勇;辛健斌;王河山;马天磊 | 申请(专利权)人: | 郑州大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;G06N3/04;G06N3/08 |
代理公司: | 焦作市科彤知识产权代理事务所(普通合伙) 41133 | 代理人: | 秦贞明 |
地址: | 450001 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 发育 网络 移动 机器人 运动 方向 预先 决策 方法 | ||
1.基于发育网络的移动机器人运动方向预先决策方法,其特征在于,包括以下步骤:
1)发育网络的创建、训练和测试;
发育网络分为三层:X层、Y层、Z层;X层作为网络输入层,其神经元个数与输入矩阵元素个数相同;Y层为中间层,设置了10000个神经元,用于存储知识;Z层作为动作输出层,每个神经元分别代表8个方向之一;
2)在每次执行任务后的非工作状态下,由动作输出层激活次数最高的某个神经元触发发育网络中间层神经元的侧向激励机制,机器人将运动过程中遇到的新知识保存,最终实现机器人运动方向的预先决策:
计算Z层神经元的激活概率pi:
其中,
按照激活概率大小排序,激活前k个概率不为0的Z层神经元,根据Top-k竞争规则,激活前k个概率不为0的Z层神经元;
激活每个概率不为0的Z层神经元时,依次执行如下过程:由Z层向Y层输入数据→激活Y层神经元→侧向激励→在新激活的神经元中保存新知识→建立保存有新知识的Y层神经元与Z层对应的神经元之间的权值连接;
发育网络的训练包括:
设置多个训练数据,保证智能体不撞上障碍物,经过训练后的机器人将空间状态的机器人、障碍物和目标三者的相对位置情况转换为数据的形式:
网络输入数据:
网络输出数据:n;
在任意时刻,以机器人为坐标原点建立坐标系,其中:
θf:目标与x轴的夹角;
θe:障碍物与x轴的夹角;
df:目标和机器人的距离;
de:障碍物和机器人的距离;
n:大小取值为1~8,代表机器人运动的八个方向,这八个方向将二维平面八等分。
2.根据权利要求1所述的基于发育网络的移动机器人运动方向预先决策方法,其特征在于:
发育网络中,X层到Y层以及Y层到Z层之间的权重更新公式为:
其中,vj代表第j个神经元的权值向量,ω1(nj)+ω2(nj)≡1,ω2(nj)是学习率,ω1(nj)是保持率,对于发放的神经元,yj=1,否则yj=0,是归一化后的输入向量,nj表示第j个神经元的发放次数。
3.根据权利要求1所述的基于发育网络的移动机器人运动方向预先决策方法,其特征在于:所述新知识是指新的环境位置信息,其确定依据为:发育网络训练好后,输入相应的输入信息,计算输入信息与机器人已经学过知识的匹配度,匹配度低于设定阈值的便认为是新知识,匹配度计算公式如下:
其中,vb和vt分别代表自底向上和自上而下的权值向量,b和t分别代表自底向上和自上而下的输入向量。
4.根据权利要求1所述的基于发育网络的移动机器人运动方向预先决策方法,其特征在于:步骤2)中,根据来自Z层的自顶向下的输入和其对应的权值,利用统一的区域函数,获得Y层神经元发放之前的能量值,根据Top-k竞争规则,激活前k个响应不为零的Y层神经元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910255732.8/1.html,转载请声明来源钻瓜专利网。