[发明专利]获取游戏强化学习模型的可解释结果的方法及相关设备在审

申请号：	202210680429.4	申请日：	2022-06-15
公开（公告）号：	CN115120986A	公开（公告）日：	2022-09-30
发明（设计）人：	黄叶;熊宇;关凯;吴润泽;范长杰;胡志鹏	申请（专利权）人：	网易（杭州）网络有限公司
主分类号：	A63F13/85	分类号：	A63F13/85;A63F13/58
代理公司：	北京风雅颂专利代理有限公司 11403	代理人：	李翔
地址：	310056 浙江省杭州***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请提供一种获取游戏强化学习模型的可解释结果的方法及相关设备。该方法包括：通过将具有多维状态的原始数据输入所述游戏强化学习模型，得到多个动作各自的第一期望回报；对于所述多维状态中的每一维状态，通过对该维状态添加噪声而由所述原始数据得到扰动数据，通过将所述扰动数据输入所述游戏强化学习模型而得到所述多个动作各自的第二期望回报，并基于所述第一期望回报和所述第二期望回报，计算该维状态对于所述多个动作各自的重要程度；通过对所述重要程度进行统计，形成所述游戏强化学习模型的状态到动作映射策略的可解释结果。可以看出，本方法对状态到动作之间的映射关系实现了可视化解释。
搜索关键词：	获取游戏强化学习模型可解释结果方法相关设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于网易（杭州）网络有限公司，未经网易（杭州）网络有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202210680429.4/，转载请声明来源钻瓜专利网。

上一篇：基于车联网技术的电动客车运营工况分析和电机选型方法
下一篇：一株高产溶葡萄球菌酶的大肠杆菌突变体

同类专利

专利分类

A 农业

A63 运动；游戏；娱乐活动
A63F 纸牌、棋盘或轮盘赌游戏；利用小型运动物体的室内游戏；其他类目不包含的游戏
A63F13-00 使用二维或多维电子显示器
A63F13-02 .附件
A63F13-08 .结构零件或布置，例如其他类目不包括的壳体、导线、连接件、操纵台
A63F13-10 .游戏过程的控制，例如开始、进行、结束
A63F13-12 .涉及若干游戏装置之间的相互作用，例如传送和分配系统
A63F13-04 ..用于命中显示器上的特殊区域，如具有光电探测装置的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]获取游戏强化学习模型的可解释结果的方法及相关设备在审

专利文献下载