[发明专利]用于作战仿真的模型的训练方法、装置、设备和存储介质有效
申请号: | 201910452394.7 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110147883B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 鹿涛;秦毅;赵昊;魏晓龙;张帅;苑聪 | 申请(专利权)人: | 航天科工系统仿真科技(北京)有限公司 |
主分类号: | G06N3/10 | 分类号: | G06N3/10 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 马晓腾 |
地址: | 100089 北京市海淀区北坞*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种用于作战仿真的神经网络模型的训练方法、装置、设备和存储介质,该方法包括:获取多组第一环境信息;将任意一组第一环境信息输入至预先构建的神经网络模型,得到第一次要执行的动作;并应用预先训练的评估模型对第一次执行动作进行评分,根据评分结果更新预先构建的神经网络模型的参数;根据参数优化预先构建的神经网络模型;依次将其余的每一组第一环境信息输入至上一次优化后的神经网络模型,得到该组第一环境信息对应的要执行的动作,并执行对应的动作,应用预先训练的评估模型对本次执行动作进行评分,直至优化后的神经网络模型满足第一收敛条件,确定第一目标神经网络模型。应用到作战仿真平台中,使作战行为更智能。 | ||
搜索关键词: | 用于 作战 仿真 模型 训练 方法 装置 设备 存储 介质 | ||
【主权项】:
1.一种用于作战仿真的神经网络模型的训练方法,其特征在于,包括:获取多组第一环境信息,其中,每组第一环境信息包括第一物理环境信息和来自对抗方的第一环境信息,所述对抗方的第一环境信息为所述对抗方基于规则的行为策略产生;将任意一组第一环境信息输入至预先构建的神经网络模型,得到第一次要执行的动作;执行所述第一次要执行的动作,并应用预先训练的评估模型对所述第一次执行动作进行评分,根据评分结果更新所述预先构建的神经网络模型的参数;根据所述参数优化所述预先构建的神经网络模型;依次将其余的每一组第一环境信息输入至上一次优化后的神经网络模型,得到该组第一环境信息对应的要执行的动作,并执行对应的动作,应用预先训练的评估模型对本次执行动作进行评分,直至优化后的神经网络模型满足第一收敛条件,确定第一目标神经网络模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天科工系统仿真科技(北京)有限公司,未经航天科工系统仿真科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910452394.7/,转载请声明来源钻瓜专利网。