[发明专利]多样性策略的生成方法、装置、介质和计算设备在审
申请号: | 202111668462.7 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114282640A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 北京瑞莱智慧科技有限公司 |
主分类号: | G06N3/02 | 分类号: | G06N3/02 |
代理公司: | 北京箴思知识产权代理有限公司 11913 | 代理人: | 李春晖;曾晓波 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请的实施例涉及人工智能技术领域,一些实施例提供了一种多样性策略的生成方法、装置、介质和计算设备。该方法包括:获取当前状态数据、指示参数以及环境奖励;所述当前状态数据中包括但不限于多个终端设备的当前观测状态数据;将所述多个终端设备的当前观测状态数据和所述指示参数输入至神经网络模型,得到虚拟奖励;根据所述虚拟奖励、所述环境奖励以及预设的约束参数得到总奖励;根据所述总奖励对累积奖励进行更新,得到更新后的累积奖励;如果所述累积奖励达到预设的目标奖励,根据预设变分下届阈值、所述当前状态数据以及指示参数得到多样性策略,所述多样性策略用于配置多个终端设备。本申请的方法能够使神经网络模型的鲁棒性提升。 | ||
搜索关键词: | 多样性 策略 生成 方法 装置 介质 计算 设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京瑞莱智慧科技有限公司,未经北京瑞莱智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111668462.7/,转载请声明来源钻瓜专利网。