[发明专利]一种基于改进的生物启发神经网络的多智能体协同目标搜索方法在审
申请号: | 202011366198.7 | 申请日: | 2020-11-29 |
公开(公告)号: | CN112465127A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 刘明雍;李晓玉;牛云 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06N3/06 | 分类号: | G06N3/06;G06N3/04;G06N3/08 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 陈星 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 生物 启发 神经网络 智能 体协 目标 搜索 方法 | ||
1.一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,其特征在于:
包括以下步骤:
步骤1:将搜索区域栅格化:
将搜索区域分隔成大小相同,互不重叠的m×n个栅格,每个栅格都代表一个离散的神经元,每个神经元的初始活性值均为零;
步骤2:初始化神经元的外部输入激励:
在栅格地图中,将智能体没有到过的区域称为未覆盖区域,并且设置神经元的外部输入激励为+E;智能体到过的区域称为已覆盖区域,并且设置神经元的外部输入激励为0;将障碍物所在的区域称为障碍物区域,并且设置神经元的外部输入激励为-E;
步骤3:初始化神经网络的活性值:
根据步骤2中每个神经元的外部输入激励,按照神经网络活性值计算公式,计算整个搜索区域中各个神经元的活性值:
其中,xi为栅格i对应神经元的活性值,A,B和D为设定常数,-A反映了栅格i对应神经元的活性值xi的衰减速率,B和D分别为神经元活性值的上下限值;Ii表示栅格i对应神经元的外部输入激励信号,其中未覆盖区域神经元的外部输入激励为E,障碍物区域神经元的外部输入激励为-E,已覆盖区域神经元的外部输入激励为0,E为远大于B的正常数,[Ii]+=max{Ii,0},[Ii]-=max{-Ii,0};
代表了栅格i对应神经元受到来自其感知区域内的其他正活性神经元的输入总和,k是栅格i对应神经元可感知的神经元数量;wij表示栅格i对应神经元与栅格j对应神经元之间的连接权值,wij=f(dij),dij=|qi-qj|表示栅格i对应神经元所在位置向量qi和栅格j对应神经元所在位置向量qj之间的欧式距离,f为递减函数;
步骤4:基于障碍物膨胀原理,更新神经网络活性值:
步骤4.1:智能体i利用自身感器探测其感知范围内是否有智能体j存在,如果有,则将智能体j所在栅格及智能体j周围的8个邻居栅格的神经元的外部输入激励设置为-E,如果没有,则按照步骤2设置神经元的外部输入激励;
步骤4.2:按照步骤4.1的神经元外部输入激励,利用神经网络活性值计算公式,更新整个神经网络神经元的活性值;
步骤5:基于预测控制的多步搜索策略,决策智能体下一时刻的位置:
步骤5.1:基于智能体i当前时刻的状态,预测未来T时刻的状态,T为预测时域,得到智能体决策树的不同的候选路径;
步骤5.2:对于每条候选路径,均计算候选路径中的神经元活性值总和,选择活性值总和最大的路径作为下一时刻的移动位置;
步骤5.3:智能体移动到步骤5.2决策的位置,判断智能体探测范围内是否存在目标,若存在目标,则结束搜索;若不存在目标,设置智能体当前所在神经元的外部输入激励为0,并且返回步骤4更新神经网络的活性值,继续搜索目标。
2.根据权利要求1所述一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,其特征在于:步骤3中递减函数采用:
式中u是非负数,r0是神经元的感知半径。
3.根据权利要求2所述一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,其特征在于:每个神经元的最大神经元感知数量为8。
4.根据权利要求1所述一种基于改进的生物启发神经网络的多智能体协同目标搜索方法,其特征在于:步骤5中,下一时刻智能体的移动方向是基于当前时刻运动方向直行、向左转45°、右转45°三种状态,则未来T时刻有3T个候选路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011366198.7/1.html,转载请声明来源钻瓜专利网。