[发明专利]镜像损失神经网络在审
申请号: | 201880006613.2 | 申请日: | 2018-03-19 |
公开(公告)号: | CN110192205A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | P.瑟马内特 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/00;G06K9/62 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书涉及神经网络,该神经网络具有多个网络参数并且被配置为接收表征环境的状态的输入观察并且处理输入观察以生成环境的状态的数字嵌套。该神经网络可以用于控制机器人智能体。可以使用包括以下步骤的方法来训练该网络:获得由第一模态捕获的第一观察;获得与第一观察一起发生并且由第二不同的模态捕获的第二观察;获得由第一模态捕获的不与第一观察一起发生的第三观察;确定三元组损失的梯度,所述三元组损失使用第一观察、第二观察和第三观察;以及使用所述三元组损失的梯度来更新所述网络参数的当前值。 | ||
搜索关键词: | 观察 神经网络 三元组 捕获 网络参数 第一模 嵌套 控制机器人 智能体 模态 更新 配置 网络 | ||
【主权项】:
1.一种训练具有多个网络参数的神经网络的方法,其中,所述神经网络被配置为接收表征环境的状态的输入观察并且处理所述输入观察以生成所述环境的状态的数字嵌套,所述方法包括:获得由第一模态捕获的第一观察;获得与第一观察一起发生并且由不同的第二模态捕获的第二观察;获得由第一模态捕获的不与第一观察一起发生的第三观察;确定三元组损失的梯度,所述三元组损失使用第一观察作为锚点示例、使用第二观察作为正示例并且使用第三观察作为负示例;以及使用所述三元组损失的梯度来更新所述网络参数的当前值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201880006613.2/,转载请声明来源钻瓜专利网。