[发明专利]基于人机交互的无人机集群导航方法、装置和设备有效
申请号: | 202111125458.6 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113566831B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 何华;周鑫;王彦锋;李小波;杨松;井田 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G01C21/20 | 分类号: | G01C21/20;G05D1/10;G06N3/00 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 彭小兰 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人机交互 无人机 集群 导航 方法 装置 设备 | ||
1.一种基于人机交互的无人机集群导航方法,其特征在于,所述方法包括:
构建人机协同导航框架;所述人机协同导航框架中包括:搜索价值、搜索代价和回报值;所述搜索价值是无人机对区域进行探索得到的反馈值,所述区域是对地理环境进行网格划分得到的;所述搜索代价是根据无人机对区域进行探索时的资源消耗确定的;所述回报值是所述搜索价值和所述搜索代价的差值;所述反馈值包括:无人机低空探测所采集到的反馈值以及人机交互时接收到的反馈值;
将无人机定义为动态规划中的智能体;所述智能体能够根据已探索的区域选择回报值最大的区域作为导航方案;
根据已探索区域对应的方案信息和未探索区域对应的方案信息,将多个智能体的多动态规划问题转化为系统状态评估函数;所述系统状态评估函数为已探索区域对应的方案信息对应的已知价值集合和未探索区域对应的方案信息在预设状态时,多智能体执行导航方案的期望回报值;
采用SADP算法求解所述系统状态评估函数,得到每个智能体的导航方案,根据每个智能体的导航方案,得到无人机集群的导航路径;
根据已探索区域对应的方案信息和未探索区域对应的方案信息,将多个智能体的多动态规划问题转化为系统状态评估函数,包括:
将所述系统状态评估函数分解为每个智能体的期望回报值为:
其中,,表示第k个智能体的子系统状态评估函数,表示每个智能体的方案选择不同;
根据无人机探测时反馈值的类型,构建每个智能体的迭代公式如下:
其中,表示无人机选择低空探测时的系统状态评估函数,表示无人机选择人机交互时的系统状态评估函数;
无人机选择低空探测时的系统状态评估函数为:
无人机选择人机交互时的系统状态评估函数为:
其中,
2.根据权利要求1所述的方法,其特征在于,所述将无人机定义为动态规划中的智能体,包括:
确定每个智能体的导航方案为:
其中,表示已探索的区域对应的已探索方案,表示智能体的输入。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
定义无人机选择低空探测时的系统状态评估函数的期望状态评估值为:
其中,的概率为,的概率为;
定义无人机选择人机交互时的系统状态评估函数的期望状态评估值为:
其中,的概率为,的概率为。
4.根据权利要求3所述的方法,其特征在于,在采用SADP算法求解所述系统状态评估函数,得到每个智能体的导航方案之前,还包括:
根据低空探测时的系统状态评估函数和系统状态评估函数的期望状态评估值,以及人机交互时的系统状态评估函数和系统状态评估函数的期望状态评估值,确定执行行动和行动的决策指标分别记为和为:
进一步化简得到:
根据系统状态和指标集合,确定搜索规则;所述搜索规则包括:判断规则和停止规则;所述判断规则指示智能体探索未探索区域而执行动作,所述停止规则当前最大价值大于所有未知方案的决策指标时,则停止搜索并选择具有最大价值的导航方案作为最终导航方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111125458.6/1.html,转载请声明来源钻瓜专利网。