[发明专利]奖励增强模型训练在审
申请号: | 201780052196.0 | 申请日: | 2017-08-25 |
公开(公告)号: | CN109791631A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | M.舒斯特;S.本吉奥;N.杰特利;Z.陈;D.E.舒尔曼斯;M.诺罗齐;Y.吴 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种方法包括获得识别要被训练以执行机器学习任务的机器学习模型的数据,所述机器学习模型被配置为接收输入示例并且根据多个模型参数的当前值来处理所述输入示例,以为所述输入示例生成模型输出;获得用于训练所述机器学习模型的初始训练数据,所述初始训练数据包括多个训练示例、以及对于每个训练示例,包括应当由所述机器学习模型通过处理所述训练示例生成的基础事实输出;从所述初始训练数据生成经修改的训练数据;以及在所述经修改的训练数据上训练所述机器学习模型。 | ||
搜索关键词: | 机器学习模型 初始训练数据 训练数据 输出 基础事实 机器学习 接收输入 模型参数 模型训练 生成模型 奖励 配置 | ||
【主权项】:
1.一种方法,包括:获得识别要被训练以执行机器学习任务的机器学习模型的数据,所述机器学习模型被配置为接收输入示例并且根据多个模型参数的当前值来处理所述输入示例,以为所述输入示例生成模型输出;获得用于训练所述机器学习模型的初始训练数据,所述初始训练数据包括多个训练示例、以及针对每个训练示例包括应当由所述机器学习模型通过处理所述训练示例生成的基础事实输出;对于所述初始训练数据中的一个或多个训练示例中的每一个训练示例,从所述初始训练数据生成经修改的训练数据:通过对于多个候选辅助输出中的每一个候选辅助输出,基于所述候选辅助输出相对于所述训练示例的所述基础事实输出的质量的相应测量,从所述多个候选辅助输出中进行选择,以从所述训练示例的所述基础事实输出为所述训练示例生成辅助输出,以及将所述训练示例的所述基础事实输出替换为所述训练示例的所述辅助输出;以及在所述经修改的训练数据上训练所述机器学习模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780052196.0/,转载请声明来源钻瓜专利网。