[发明专利]虚拟对象行为策略的训练方法及装置、电子设备、存储介质在审
申请号: | 201911254761.9 | 申请日: | 2019-12-09 |
公开(公告)号: | CN111026272A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 贾航天;林磊 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06N20/00 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 王文红 |
地址: | 310052 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种虚拟对象行为策略的训练方法及装置、电子设备、存储介质,属于人工智能技术领域,具体包括:获取虚拟对象执行交互动作的前后状态数据;根据预先为虚拟对象所执行任务配置的带有梯度变化的奖励函数,计算虚拟对象执行交互动作的奖励值;其中,梯度随虚拟对象执行交互动作后的当前状态与目标状态之间的距离变化;利用执行交互动作的前后状态数据和奖励值,训练到达目标状态的行为策略。故奖励值的变化规律更符合人类和动物的学习规律,从而提高训练效率,更加快速地模仿人类和动物的学习过程。 | ||
搜索关键词: | 虚拟 对象 行为 策略 训练 方法 装置 电子设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911254761.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种数控机床刀库刀具信息存储与调用方法
- 下一篇:电子设备