[发明专利]一种基于状态策略知识库指导的智能体自主避障方法有效
申请号: | 202110264968.5 | 申请日: | 2021-03-08 |
公开(公告)号: | CN113093730B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 向隆刚;李雅丽 | 申请(专利权)人: | 武汉大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 许莲英 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 状态 策略 知识库 指导 智能 自主 方法 | ||
1.一种基于状态策略知识库指导的智能体自主避障方法,其特征在于,包括以下步骤:
步骤1:感知避障环境,智能体在按照已有路径规划前进的前提下,感知障碍物信息,判断是否需要采取避障措施;若需要避障,则构建避障环境状态,进行步骤2,反之则不做避障处理;
步骤2:将步骤1中所述的避障环境状态与状态策略知识库中已知状态策略进行匹配;若匹配不成功表示步骤1中所述的避障环境状态为未知的新状态,则进入步骤3;若匹配成功表示步骤1中所述的避障环境状态为已知状态,则进入步骤4;
步骤3:将未知的新状态通过模糊神经网络预测输出避障执行速度、避障执行转向角,将避障执行速度、避障执行转向角作为避障策略以指导智能体避障,并将未知的新状态、避障策略以状态策略形式添加至步骤2所述状态策略知识库;
步骤4:在状态策略知识库中搜索已知状态对应的策略作为避障策略,用于指导智能体避障;
步骤5:通过超宽带系统判断智能体是否到达此次避障目标点,若已到达目标点,则结束避障,并退出;否则,重复执行步骤1至步骤2直至智能体到达避障目标点;
步骤1所述感知障碍物信息的具体步骤为:
步骤1.1:基于三个激光雷达传感器,分别获取检测到的障碍物直线距离和扫描角度,以减少单个激光雷达传感器的广角误差;
步骤1.2:根据当前周期T下,障碍物与智能体的直线距离D,以及上个周期T-△t下,障碍物与智能体的直线距离信息D′,应用坐标转换模型,计算在障碍物以智能体为原点,智能体朝向为Y轴方向的坐标系下的位置;
所述坐标转换模型如下:
式中,dx为当前周期下障碍物与智能体在X轴方向上的距离;dy为当前周期下障碍物与智能体在Y轴方向上的距离;d’x为上一个周期下障碍物与智能体在X轴方向上的距离;d’y为上一个周期下障碍物与智能体在X轴方向上的距离;D1表示第一激光雷达传感器获取的距离信息,D2表示第二激光雷达传感器获取的距离信息,D3表示第三激光雷达传感器获取的距离信息,θ1表示第一激光雷达传感器的扫描角度,θ2表示第二激光雷达传感器的扫描角度,θ3表示第三激光雷达传感器的扫描角度;
然后根据避障判断模型进行避障判断,若满足条件则无需避障,直接退出;否则判断为需要避障进入步骤1.3;
所述避障判断模型为:
dy-dy'-vΔt<0
式中,v是智能体速度,通过车速传感器获取;△t为激光雷达传感器检测周期;
步骤1.3:根据障碍物与智能体之间的直线距离和角度,计算障碍物相对于智能体的运动方向to,具体如下:
式中,to为障碍物相对于智能体的运动方向;ε为距离阈值;to=-1表示障碍物相对智能体向左运动;to=1表示障碍物相对智能体向右运动;
步骤1.4:单次避障是指智能体从检测到障碍物开始,到智能体行驶至此次避障的目标点的过程;首先计算目标点与智能体的坐标差值,具体如下:
式中,Ro为障碍物半径,统一设定为0.3米;Ra为智能体半径,统一设定为0.3米;
然后基于目标点与智能体的坐标差值,和上述步骤1.3中计算的障碍物相对运动方向to,计算智能体与目标点的航向角:
此时,目标角度ta的计算公式为:ta=θa-α,式中α为智能体的航向角,通过高精度转角仪测得;
步骤1.5:通过第一激光雷达传感器获取的距离信息、第二激光雷达传感器获取的距离信息、第三激光雷达传感器获取的距离信息、障碍物相对运动方向、目标角度构建避障环境状态;
所述避障环境状态为:
S=[D1,D2,D3,to,ta];
其中,D1表示第一激光雷达传感器获取的距离信息,D2表示第二激光雷达传感器获取的距离信息,D3表示第三激光雷达传感器获取的距离信息,to为障碍物相对于智能体的运动方向,ta表示目标角度;
步骤2所述状态策略知识库用于存储已知的避障环境状态和已知的避障环境状态对应的策略;
步骤2所述状态策略知识库的定义为:
KBS=[R1,R2,...,Rm]
其中,KBS表示状态策略知识库,m表示状态策略知识库中已知状态策略的数量,Ri表示状态策略知识库中第i条已知状态策略,具体定义为:
其中,表示状态策略知识库中第i条已知状态策略中状态,表示状态策略知识库中第i条已知状态策略中策略,表示已知的第一激光雷达传感器获取的距离信息,表示已知的第二激光雷达传感器获取的距离信息,表示已知的第三激光雷达传感器获取的距离信息,为已知的障碍物相对于智能体的运动方向,已知的表示目标角度,为已知的避障执行速度,为已知的避障执行转向角;
步骤2所述与状态策略知识库中已知状态策略进行匹配为:
根据绝对值指数法度量感知的避障环境状态S中的每一项与状态策略知识库中的已知状态策略R中的状态之间的相似度sim(S,R)
式中,Sf代表避障环境状态中第f个属性值,代表中的第f个属性值,wf是第f个属性对应的权重,C为设定阈值:
若sim(S,R)C为步骤2所述匹配成功;
若sim(S,R)=C为步骤2所述匹配不成功;
步骤3所述的模糊神经网络的结构由输入层、变量隶属度转换层、模糊规则适应度层、归一化层、输出层依次级联构成;
所述输入层,输入状态S中的5个特征值,节点n=5;
所述变量隶属度转换层,设定3个距离变量D分为{“远”,“近”}两个等级,1个障碍物运动方向to分为{“左”,“右”}两个等级,1个智能体目标角度ta分为{“偏左大”,“偏左小”,“无偏”,“偏右小”,“偏右大”}五个等级;
所述变量隶属度转换层的节点数量为各变量的模糊分割个数之和;
所述变量隶属度转换层根据矩形函数计算各变量的隶属度,具体如下:
式中,β为模糊分割的阈值;
所述模糊规则适应度层,用来匹配模糊规则的前件,每个节点代表一条模糊规则,所述模糊规则适应度层节点数为各变量的模糊分割个数之积;
所述归一化层,节点数与第三层相同;
所述输出层,通过加权平均法去模糊化,输出的变量为智能体的避障执行速度和智能体的避障执行转向角;
步骤4所述避障策略由避障执行速度v、避障执行转向角w构成 。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110264968.5/1.html,转载请声明来源钻瓜专利网。