[发明专利]训练机器学习模型在审

申请号：	201780030921.4	申请日：	2017-05-19
公开（公告）号：	CN109313721A	公开（公告）日：	2019-02-05
发明（设计）人：	米沙·万·雷·德尼尔;汤姆·绍尔;马尔钦·安德里霍维奇;若昂·费迪南多·戈梅斯·德弗雷塔斯;塞尔吉奥·戈梅斯·科梅纳雷霍;马修·威廉·霍夫曼;戴维·本杰明·普福	申请（专利权）人：	渊慧科技有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08
代理公司：	中原信达知识产权代理有限责任公司 11219	代理人：	李宝泉;周亚荣
地址：	英国***	国省代码：	英国;GB
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型参数训练机器机器学习模型更新规则时步计算机存储介质递归神经网络优化目标函数计算机程序学习应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

用于训练机器学习模型的方法、系统和装置，包括在计算机存储介质上编码的计算机程序。一种方法包括获得机器学习模型，其中机器学习模型包括一个或多个模型参数，并且使用梯度下降技术来训练机器学习模型以优化目标函数；使用递归神经网络(RNN)确定模型参数的更新规则；以及将用于多个时步序列中的最终时步的确定的更新规则应用于模型参数。

技术领域

本说明书涉及神经网络。

背景技术

背神经网络是机器学习模型，其采用一层或多层非线性单元以针对接收到的输入预测输出。除了输出层之外，一些神经网络还包括一个或多个隐藏层。每个隐藏层的输出用作网络中下一层(即，下一个隐藏层或输出层)的输入。网络的每个层根据相应参数集的当前值从接收的输入生成输出。

发明内容

本说明书描述在一个或多个位置中的一个或多个计算机上实现为计算机程序的系统能够如何用可训练的深度递归神经网络替换硬编码的参数优化算法，例如，梯度下降优化算法。针对机器学习模型的参数的手工设计的更新规则被替换成学习更新规则。

通常，本说明书中描述的主题的一个创新方面能够体现在包括获得机器学习模型的方法中，其中(i)机器学习模型包括一个或多个模型参数，并且(ii)使用梯度下降技术来训练机器学习模型以优化目标函数；对于多个时步中的每个时步：使用递归神经网络(RNN)确定针对时步的用于模型参数的更新规则，包括：向RNN提供目标函数相对于用于时步的模型参数的梯度作为输入；从针对时步提供的输入生成相应的RNN输出，其中RNN输出包括取决于一个或多个RNN参数的针对时步的用于模型参数的更新规则；使用所生成的输出和取决于多个时步中的每个先前时步的RNN目标函数训练RNN，包括使用梯度下降技术确定针对时步使RNN目标函数最小化的RNN参数；基于所确定的RNN参数，确定针对时步使目标函数最小化的模型参数的更新规则；以及将确定的用于时步的更新规则应用于模型参数。

此方面的其他实施例包括记录在一个或多个计算机存储设备上的相应的计算机系统、装置和计算机程序，每个计算机系统、装置和计算机程序被配置成执行方法的动作。一个或多个计算机的系统能够被配置成借助于安装在系统上的在操作中可以使系统执行动作的软件、固件、硬件或其任何组合来执行特定操作或动作。一个或多个计算机程序能够被配置成借助于包括当由数据处理装置执行时使装置执行动作的指令来执行特定操作或动作。

前述和其他实施例能够均可选地包括一个或多个下述特征，单独或组合。在一些实施方式中，将针对多个时步中的最终时步的所确定的更新规则应用于模型参数，生成训练的模型参数。

在一些实施方式中，机器学习模型包括神经网络。

在一些实施方式中，通过下述给出针对最小化目标函数的模型参数的被确定的更新规则

其中θ_t表示在时间t处的模型参数，表示目标函数f的梯度，φ表示RNN参数并且g_t表示在时步t处的RNN输出。

在一些实施方式中，RNN在目标函数参数上以坐标方式操作。

在一些实施方式中，RNN为每个模型参数实现单独的激活。

在一些实施方式中，将针对时步的被确定的更新规则应用于模型参数包括使用长短期记忆(LSTM)神经网络。

在一些实施方式中，LSTM神经网络包括两个LSTM层。

在一些实施方式中，LSTM神经网络跨目标函数的不同坐标共享参数。

在一些实施方式中，每个LSTM层中的元胞的子集包括全局平均单元，其中全局平均单元是其更新包括跨越不同坐标方式的LSTM在每个步骤全局地对单元的激活取平均的步骤的单元。

在一些实施方式中，在每个坐标上独立地应用相同的更新规则。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。