[发明专利]训练机器学习模型在审
申请号: | 201780030921.4 | 申请日: | 2017-05-19 |
公开(公告)号: | CN109313721A | 公开(公告)日: | 2019-02-05 |
发明(设计)人: | 米沙·万·雷·德尼尔;汤姆·绍尔;马尔钦·安德里霍维奇;若昂·费迪南多·戈梅斯·德弗雷塔斯;塞尔吉奥·戈梅斯·科梅纳雷霍;马修·威廉·霍夫曼;戴维·本杰明·普福 | 申请(专利权)人: | 渊慧科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;周亚荣 |
地址: | 英国*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型参数 训练机器 机器学习模型 更新规则 时步 计算机存储介质 递归神经网络 优化目标函数 计算机程序 学习 应用 | ||
用于训练机器学习模型的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。一种方法包括获得机器学习模型,其中机器学习模型包括一个或多个模型参数,并且使用梯度下降技术来训练机器学习模型以优化目标函数;使用递归神经网络(RNN)确定模型参数的更新规则;以及将用于多个时步序列中的最终时步的确定的更新规则应用于模型参数。
技术领域
本说明书涉及神经网络。
背景技术
背神经网络是机器学习模型,其采用一层或多层非线性单元以针对接收到的输入预测输出。除了输出层之外,一些神经网络还包括一个或多个隐藏层。每个隐藏层的输出用作网络中下一层(即,下一个隐藏层或输出层)的输入。网络的每个层根据相应参数集的当前值从接收的输入生成输出。
发明内容
本说明书描述在一个或多个位置中的一个或多个计算机上实现为计算机程序的系统能够如何用可训练的深度递归神经网络替换硬编码的参数优化算法,例如,梯度下降优化算法。针对机器学习模型的参数的手工设计的更新规则被替换成学习更新规则。
通常,本说明书中描述的主题的一个创新方面能够体现在包括获得机器学习模型的方法中,其中(i)机器学习模型包括一个或多个模型参数,并且(ii)使用梯度下降技术来训练机器学习模型以优化目标函数;对于多个时步中的每个时步:使用递归神经网络(RNN)确定针对时步的用于模型参数的更新规则,包括:向RNN提供目标函数相对于用于时步的模型参数的梯度作为输入;从针对时步提供的输入生成相应的RNN输出,其中RNN输出包括取决于一个或多个RNN参数的针对时步的用于模型参数的更新规则;使用所生成的输出和取决于多个时步中的每个先前时步的RNN目标函数训练RNN,包括使用梯度下降技术确定针对时步使RNN目标函数最小化的RNN参数;基于所确定的RNN参数,确定针对时步使目标函数最小化的模型参数的更新规则;以及将确定的用于时步的更新规则应用于模型参数。
此方面的其他实施例包括记录在一个或多个计算机存储设备上的相应的计算机系统、装置和计算机程序,每个计算机系统、装置和计算机程序被配置成执行方法的动作。一个或多个计算机的系统能够被配置成借助于安装在系统上的在操作中可以使系统执行动作的软件、固件、硬件或其任何组合来执行特定操作或动作。一个或多个计算机程序能够被配置成借助于包括当由数据处理装置执行时使装置执行动作的指令来执行特定操作或动作。
前述和其他实施例能够均可选地包括一个或多个下述特征,单独或组合。在一些实施方式中,将针对多个时步中的最终时步的所确定的更新规则应用于模型参数,生成训练的模型参数。
在一些实施方式中,机器学习模型包括神经网络。
在一些实施方式中,通过下述给出针对最小化目标函数的模型参数的被确定的更新规则
其中θt表示在时间t处的模型参数,表示目标函数f的梯度,φ表示RNN参数并且gt表示在时步t处的RNN输出。
在一些实施方式中,RNN在目标函数参数上以坐标方式操作。
在一些实施方式中,RNN为每个模型参数实现单独的激活。
在一些实施方式中,将针对时步的被确定的更新规则应用于模型参数包括使用长短期记忆(LSTM)神经网络。
在一些实施方式中,LSTM神经网络包括两个LSTM层。
在一些实施方式中,LSTM神经网络跨目标函数的不同坐标共享参数。
在一些实施方式中,每个LSTM层中的元胞的子集包括全局平均单元,其中全局平均单元是其更新包括跨越不同坐标方式的LSTM在每个步骤全局地对单元的激活取平均的步骤的单元。
在一些实施方式中,在每个坐标上独立地应用相同的更新规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渊慧科技有限公司,未经渊慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780030921.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:使用神经网络生成文本段的依存性解析
- 下一篇:存储器高效的基于时间的反向传播