[发明专利]生成环境特征的深度强化学习方法以用于计算机视觉系统的漏洞分析与改进性能在审
申请号: | 202080097385.1 | 申请日: | 2020-12-08 |
公开(公告)号: | CN115151913A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | M·A·沃伦;C·塞拉诺 | 申请(专利权)人: | 赫尔实验室有限公司 |
主分类号: | G06N3/00 | 分类号: | G06N3/00;G06N3/04;G06N3/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 张亚静;徐敏刚 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 环境 特征 深度 强化 学习方法 用于 计算机 视觉 系统 漏洞 分析 改进 性能 | ||
1.一种使用深度强化学习来生成环境特征的系统,所述系统包括:
非暂时性计算机可读介质和一个或更多个处理器,所述非暂时性计算机可读介质上编码有可执行指令,使得当执行所述可执行指令时,所述一个或更多个处理器执行以下操作:
接收策略网络架构、初始化参数和仿真环境作为输入,所述仿真环境是对通过物理环境的目标系统的轨迹进行建模的;
对从所述策略网络采样的地标特征集进行初始化;
通过使用强化学习算法对所述策略网络进行训练来生成经训练的策略网络;
使用所述经训练的策略网络来生成环境特征集;以及
在显示设备上显示所述环境特征集。
2.根据权利要求1所述的系统,其中,所述环境特征集影响机器学习感知系统对任务的执行。
3.根据权利要求2所述的系统,其中,所述机器学习感知系统采用循环神经网络(RNN)。
4.根据权利要求2所述的系统,其中,所执行的任务选自由检测、分类、跟踪、分割、文本分析以及异常检测组成的组。
5.根据权利要求1所述的系统,其中,所述一个或更多个处理器还执行训练一个或更多个生成模型的操作。
6.根据权利要求1所述的系统,其中,所述一个或更多个处理器还执行通过装置来物理实现所述环境特征集的操作。
7.根据权利要求6所述的系统,其中,所述装置是打印机。
8.一种使用深度强化学习来生成环境特征的计算机实现的方法,所述方法包括以下动作:
使一个或更多个处理器执行在非暂时性计算机可读介质上编码的指令,使得在执行时所述一个或更多个处理器执行以下操作:
接收策略网络架构、初始化参数和仿真环境作为输入,所述仿真环境是对通过物理环境的目标系统的轨迹进行建模的;
对从所述策略网络采样的地标特征集进行初始化;
通过使用强化学习算法对所述策略网络进行训练来生成经训练的策略网络;
使用所述经训练的策略网络来生成环境特征集;以及
在显示设备上显示所述环境特征集。
9.根据权利要求8所述的方法,其中,所述环境特征集影响机器学习感知系统对任务的执行。
10.根据权利要求9所述的方法,其中,所述机器学习感知系统采用循环神经网络(RNN)。
11.根据权利要求8所述的方法,其中,所述一个或更多个处理器还执行训练一个或更多个生成模型的操作。
12.根据权利要求9所述的方法,其中,所执行的任务选自由检测、分类、跟踪、分割、文本分析以及异常检测组成的组。
13.根据权利要求8所述的方法,其中,所述一个或更多个处理器还执行使通过装置来物理实现所述环境特征集的操作。
14.一种使用深度强化学习来生成环境特征的计算机程序产品,所述计算机程序产品包括:
存储在非暂时性计算机可读介质上的计算机可读指令,所述计算机可读指令能够由具有一个或更多个处理器的计算机执行,以使所述处理器执行以下操作:
接收策略网络架构、初始化参数和仿真环境作为输入,所述仿真环境是对通过物理环境的目标系统的轨迹进行建模的;
对从所述策略网络采样的地标特征集进行初始化;
通过使用强化学习算法对所述策略网络进行训练来生成经训练的策略网络;
使用所述经训练的策略网络来生成环境特征集;以及
在显示设备上显示所述环境特征集。
15.根据权利要求14所述的计算机程序产品,其中,所述环境特征集影响机器学习感知系统对任务的执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赫尔实验室有限公司,未经赫尔实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080097385.1/1.html,转载请声明来源钻瓜专利网。