[发明专利]网络训练方法、操作控制方法、装置、存储介质和设备有效
申请号: | 201711004078.0 | 申请日: | 2017-10-24 |
公开(公告)号: | CN108229678B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 马政;刘春晓;侯跃南;张伟;吕健勤 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G05B13/02;B25J9/16;B25J13/00 |
代理公司: | 北京康达联禾知识产权代理事务所(普通合伙) 11461 | 代理人: | 张雪飞;金丹 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种网络训练方法、操作控制方法、装置、存储介质和电子设备。网络训练方法包括:从至少一个训练主机分别接收状态动作样本数据,状态动作样本数据至少包括操作状态数据以及相应的动作控制数据;使用状态动作样本数据,训练用于操作控制的目标神经网络;将经过训练的目标神经网络分别发送给至少一个训练主机,以使得所述至少一个训练主机根据目标神经网络生成新的状态动作样本数据。由此,可以分布式的训练方式,不断地通过各个训练主机获取到大量的用于智能操作控制的训练样本,提高了采集训练样本的效率。此外,还能够使得训练主机持续地通过经训练的目标神经网络来获取更多的训练样本,从而提高了采集到的训练样本的质量。 | ||
搜索关键词: | 网络 训练 方法 操作 控制 装置 存储 介质 设备 | ||
【主权项】:
1.一种网络训练方法,包括:从至少一个训练主机分别接收状态动作样本数据,所述状态动作样本数据至少包括操作状态数据以及相应的动作控制数据;使用所述状态动作样本数据,训练用于操作控制的目标神经网络;将经过训练的目标神经网络分别发送给所述至少一个训练主机,以使得所述至少一个训练主机根据所述目标神经网络生成新的状态动作样本数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711004078.0/,转载请声明来源钻瓜专利网。