[发明专利]导航决策制定方法、AI模型训练方法、服务器及介质在审
申请号: | 202011325706.7 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112295232A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 张弛;武建芳;杨木;郭仁杰;王宇舟;杨正云;李宏亮;刘永升 | 申请(专利权)人: | 超参数科技(深圳)有限公司 |
主分类号: | A63F13/67 | 分类号: | A63F13/67;A63F13/837;G06N3/04;G06T19/00 |
代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 贺小旺 |
地址: | 518000 广东省深圳市南山区粤海街道高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 导航 决策 制定 方法 ai 模型 训练 服务器 介质 | ||
本申请公开了一种导航决策制定方法、AI模型训练方法、服务器及介质,其中,所述方法包括获取3D虚拟环境中智能体当前帧状态信息以及当前帧目标区域信息;通过AI模型基于所述当前帧状态信息、所述当前帧目标区域信息,输出所述智能体对应的当前帧动作输出信息及当前帧目标区域选择信息;根据所述当前帧动作输出信息和所述当前帧目标区域选择信息控制所述智能体与所述3D虚拟环境交互,以获取所述智能体的下一帧状态信息及下一帧目标区域信息;根据所述下一帧状态信息及下一帧目标区域信息获取所述智能体下一帧动作输出信息和下一帧目标区域选择信息。本申请所提供的方法可以让智能体在3D空间中的大范围地图中可靠、高效地做出正确导航决策。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种导航决策制定方法、AI模型训练方法、服务器及介质。
背景技术
随着人工智能(Artificial Intelligence,AI)技术的快速发展,人工智能技术被广泛应用于3D游戏、虚拟交通、自动驾驶仿真、机器人轨迹规划等各个领域,在3D虚拟空间中进行AI仿真具有非常大的商业价值。
目前,在部分3D虚拟空间的AI仿真中,智能体需要在3D虚拟空间中收集各种资源,并在不断缩小的安全区域内对抗其他智能体玩家,让自己生存到最后,在这个AI仿真过程中,智能体需要在不同的环境中做出正确导航决策,以使自己以相对安全区域为目标点进行转移与探索,从而使自己生存到最后。
在传统的导航策略制定方法中,由于大多数的3D虚拟空间的地图尺寸较小,智能体仅仅需要学会在3D虚拟空间中进行小范围避障然后到达目标点,这样短期的决策对于传统强化学习来说相对容易学习。因此,传统的导航决策制定方法仅可以满足环境信息简单变化的一些场景,但不适用于3D空间中的大范围地图的导航问题。
故,如何实现智能体在3D空间中的大范围地图中可靠、高效地做出正确导航决策,是目前亟需解决的问题。
发明内容
本申请实施例提供一种导航决策制定方法、AI模型训练方法、服务器及介质,可以实现智能体在3D空间中的大范围地图中可靠、高效地做出正确导航决策。
第一方面,本申请实施例提供了一种导航决策制定方法,包括:
获取3D虚拟环境中智能体当前帧状态信息及当前帧目标区域信息;
通过AI模型基于所述当前帧状态信息、所述当前帧目标区域信息,输出所述智能体对应的当前帧动作输出信息及当前帧目标区域选择信息;
根据所述当前帧动作输出信息和所述当前帧目标区域选择信息控制所述智能体与所述3D虚拟环境交互,以获取所述智能体的下一帧状态信息及下一帧目标区域信息;
根据所述下一帧状态信息及下一帧目标区域信息获取所述智能体下一帧动作输出信息和下一帧目标区域选择信息。
第二方面,本申请实施例还提供了一种AI模型的训练方法,包括:
获取样本数据集,其中,所述样本数据集包括智能体的多帧状态信息、多帧目标区域信息及多帧目标区域奖励信息;
通过预设AI模型基于所述多帧状态信息和所述多帧目标区域信息,输出所述智能体对应的多帧融合状态向量信息及多帧目标区域选择信息;
根据所述多帧融合状态向量信息、多帧目标区域选择信息及所述多帧目标区域奖励信息构建损失函数;
对所述损失函数进行多步迭代,以训练更新所述预设AI模型。
第三方面,本申请实施例还提供了一种服务器,所述服务器包括处理器、存储器;所述存储器存储有可以被所述处理器调用并执行的计算机程序及AI模型,其中,所述计算机程序被所述处理器执行时,实现上述的导航决策制定方法;或者,实现上述的AI模型的训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超参数科技(深圳)有限公司,未经超参数科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011325706.7/2.html,转载请声明来源钻瓜专利网。