[发明专利]多无人机队形变换方法及系统有效
申请号: | 202210025528.9 | 申请日: | 2022-01-11 |
公开(公告)号: | CN114326826B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 邢娜;王月海;尹文杰;邢志强;庞枫骞 | 申请(专利权)人: | 北方工业大学 |
主分类号: | G05D1/12 | 分类号: | G05D1/12 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 刘芳 |
地址: | 100144 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 无人机 队形 变换 方法 系统 | ||
1.一种多无人机队形变换方法,其特征在于,所述方法包括:
建立适用于多无人机队形变换的马尔科夫决策模型;所述马尔科夫决策模型具体包括:
状态空间:包括无人机本体的状态,与无人机本体相邻的其他无人机的状态,以及无人机本体和其他无人机的联合状态;
动作空间:由80个离散的动作组成,所述80个离散的动作包括由[0,2π]平均分成的16个方向以及由[0,vpref)区间的速度指数分割的5个区间,其中vpref为最佳速度;
回报函数:
式中,at是无人机在队形变换过程中执行的动作,为无人机本体和其他无人机的联合状态值,为无人机本体动作选择的回报值,dt为[t-Δt,t]时间段内无人机本体与其他无人机最小分距离,pg为目标位置;
状态转移概率:表示S×A→Sp的转移概率;P(st+1|st,a)表示在状态st下采取行动a状态转移到st+1的概率;
折扣因子:γ∈(0,1);
基于注意力机制以及深度价值网络算法计算马尔科夫决策模型的最优解,具体包括:
采集邻居无人机的状态动作信息,所述邻居无人机为与无人机本体相邻的无人机;
对无人机本体的状态动作信息以及所述邻居无人机的状态动作信息进行预处理,得到所述无人机本体和所述邻居无人机的联合状态特征向量;
根据所述联合状态特征向量和所述注意力机制获得注意得分;
根据所述联合状态特征向量和所述注意得分,获得综合特征值;
利用所述综合特征值和无人机本体的状态获得状态价值函数;
利用深度价值网络算法对所述状态价值函数进行迭代更新,得到最优状态价值函数;
根据最优状态价值函数获得无人机本体的最优动作选择,无人机本体的最优动作选择即为所述马尔科夫决策模型的最优解。
2.根据权利要求1所述的方法,其特征在于,所述对无人机本体的状态动作信息以及所述邻居无人机的状态动作信息进行预处理,得到所述无人机本体和所述邻居无人机的联合状态特征向量,具体包括:
构造一个地图张量;
将所述地图张量、动态障碍物的状态以及无人机本体的状态输入到第一层多层感知机,得到无人机本体与动态障碍物的第一成对特征向量,所述第一成对特征向量为一个定长向量,所述动态障碍物为与无人机本体相邻的其他无人机;
将所述第一成对特征向量输入到第二层多层感知机,获得无人机本体与动态障碍物的第二成对特征向量,所述第一成对特征向量和所述第二成对特征向量均为联合状态特征向量。
3.根据权利要求2所述的方法,其特征在于,所述根据所述联合状态特征向量和所述注意力机制获得注意得分的公式为:
αi=ψα(ei,em;Wα)
式中,ei为第一成对特征向量,所述第一成对特征向量为一个定长向量,em是与定长向量ei相同长度的嵌入向量,em是通过对ei-j算术平均获得的,ψα(·)是一个多层感知机,具有ReLU激活函数和权重Wα,αi是指注意得分。
4.根据权利要求2或3所述的方法,其特征在于,所述根据所述联合状态特征向量和所述注意得分,获得综合特征值,具体包括:对所述第二成对特征向量和所述注意得分进行加权线性组合,得到综合特征值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210025528.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种超柔经编布染色工艺
- 下一篇:一种基于多层编码网络的谣言检测方法及系统