[发明专利]多智能体对抗神经网络训练方法及装置在审
申请号: | 202011329509.2 | 申请日: | 2020-11-24 |
公开(公告)号: | CN112347699A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 白桦;王群勇;孙旭朋 | 申请(专利权)人: | 北京圣涛平试验工程技术研究院有限责任公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F119/02 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郭亮 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 对抗 神经网络 训练 方法 装置 | ||
1.一种多智能体对抗神经网络训练方法,其特征在于,包括:
对影响智能体的可靠性、维修性和保障性指标进行分析,提取影响总体性能的关键指标,并确定关键指标的取值;
每次训练时,采用蒙特卡洛方法,模拟多智能体在所述关键指标情况下的实际状态;
根据所述实际状态,对构建的多智能体对抗神经网络进行训练。
2.根据权利要求1所述的多智能体对抗神经网络训练方法,其特征在于,所述根据所述实际状态,对构建的多智能体对抗神经网络进行训练,包括:
根据所述实际状态,确定输入环境变量,以回报最大化为目标,对构建的多智能体强对抗神经网络进行训练。
3.根据权利要求1所述的多智能体对抗神经网络训练方法,其特征在于,所述多智能体为执行任务的飞机集群,相应地:
所述多智能体对抗神经网络,用于评估所述飞机集群任务成功率;
所述关键指标,包括:飞机的失效率、战备完好率和通信中断率。
4.根据权利要求3所述的多智能体对抗神经网络训练方法,其特征在于,所述采用蒙特卡洛方法,模拟多智能体在所述关键指标情况下的实际状态,包括:
根据飞机总架数和战备完好率,采用蒙特卡洛方法,确定能出动的飞机架数。
5.根据权利要求4所述的多智能体对抗神经网络训练方法,其特征在于,所述采用蒙特卡洛方法,模拟多智能体在所述关键指标情况下的实际状态,还包括:
根据能出动的飞机架数和飞机失效率,采用蒙特卡洛方法,确定故障飞机,并将故障飞机移除,得到可执行任务的飞机架数。
6.根据权利要求5所述的多智能体对抗神经网络训练方法,其特征在于,所述采用蒙特卡洛方法,模拟多智能体在所述关键指标情况下的实际状态,还包括:
根据可执行任务的飞机架数和通信中断率,采用蒙特卡洛方法,确定通信异常的飞机。
7.根据权利要求6所述的多智能体对抗神经网络训练方法,所述根据所述实际状态,对构建的多智能体对抗神经网络进行训练,包括:
以可执行任务的飞机和通信正常的飞机,作为输入环境变量,以任务成功率最高为目标,对构建的多智能体强对抗神经网络进行训练。
8.一种多智能体对抗神经网络训练装置,其特征在于,包括:
指标确定模块,用于对影响智能体的可靠性、维修性和保障性指标进行分析,提取影响总体性能的关键指标,并确定关键指标的取值;
状态确定模块,用于每次训练时,采用蒙特卡洛方法,模拟多智能体在所述关键指标情况下的实际状态;
网络训练模块,用于根据所述实际状态,对构建的多智能体对抗神经网络进行训练。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述多智能体对抗神经网络训练方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述多智能体对抗神经网络训练方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京圣涛平试验工程技术研究院有限责任公司,未经北京圣涛平试验工程技术研究院有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011329509.2/1.html,转载请声明来源钻瓜专利网。