[发明专利]一种基于GRU的递归神经网络多标签学习方法在审

专利信息
申请号: 201810112481.3 申请日: 2018-02-05
公开(公告)号: CN108319980A 公开(公告)日: 2018-07-24
发明(设计)人: 王磊;翟荣安;王毓;王纯配;刘晶晶;王飞;于振中;李文兴 申请(专利权)人: 哈工大机器人(合肥)国际创新研究院
主分类号: G06K9/62 分类号: G06K9/62;G06N3/08
代理公司: 北京华际知识产权代理有限公司 11676 代理人: 陈晓蕾
地址: 230601 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 递归神经网络 标签 初始化系统 上下文向量 输出层输出 标签分类 标签向量 迭代更新 反向传播 模型参数 目标函数 神经网络 输出计算 输出优化 有效特征 下降法 准确率 求解 取样 算法 学习 输出 返回 预测 更新
【说明书】:

发明提供一种基于GRU的递归神经网络多标签学习方法,所述方法包括以下步骤:步骤S1:初始化系统参数θ=(W,U,B);步骤S2:输入样例计算各时刻RNN输出隐状态hT,其中,样例yi是样例xi的多标签向量,步骤S3:计算上下文向量hT以及输出层输出zi;步骤S4:计算预测输出计算损失Li,确定目标函数J;步骤S5:根据梯度下降法和BPTT算法求解θ=(W,U,B)的梯度;步骤S6:确定学习率η,更新各权值梯度W=W‑η·δW;步骤S7:判断神经网络是否达到稳定,如果是执行步骤S8;如果否,返回步骤S2,迭代更新模型参数;步骤S8:输出优化模型。本发明能充分利RNN获取样例的有效特征表示,提高多标签分类的准确率,并且反向传播时不容易出现梯度消失问题。

技术领域

本发明涉及递归神经网络多标签学习领域,尤其涉及一种基于GRU的递归神经网络多标签学习方法。

背景技术

在机器学习领域,多标签分类在分类问题中有着重要的地位。传统的标签分类问题是从标签集合中学习样例的单个标签,这样的问题被称为二分类问题(或者文本和网络数据过滤问题)。多标签分类问题中每个样例有一组相关的标签。在解决多标签分类问题上,近年来出现了很多方法,方法基本上分为两种,一种是将问题转化为传统的单标签分类。这种方法通过多个二元分类器分别学习标签集合中的每个标签。二是调整现有的算法来适应多标签的分类。

对于序列数据的建模,基于神经网络(Neural Network)的模型已经在广播演讲识别、语言模型以及录像分类问题上取得了优异的成绩。这些模型大部分属于两类神经网络,前馈神经网络(Feedforward Neural Network)和递归神经网络(Recurrent NeuralNetwork)。递归结构的神经网络能循序渐进的表示时刻信息。递归神经网络(RecurrentNeural Network,RNN)的递归特性表现在它的某一时刻隐藏层状态依赖于前一时刻的输出状态。这种循环使模型能够存储任意时间长度的复杂信息,隐藏层状态可看作是模型的记忆单元,其结构以及展开如图1所示。

传统RNN递归隐藏层网络模块的形式比较单一,如图2所示。理论上,RNN可以学习无限长的序列信息。但是,实践证明,时间间隔越大RNN的这种学习能力就会越弱。并且这种循环结构很难训练,因为它很容易出现梯度消失和梯度爆炸。Mikolov通过梯度裁剪方法防止梯度爆炸,这种方法简单可行。这就允许这些模型可以在大的数据集上使用梯度下降法和BPTT(Back-propagation Through Time)算法训练。由于在沿时间反向传播时,它们的梯度可能呈指数衰减,因此递归神经网络依旧有梯度消失的问题。这使RNN只能处理短距离信息而忽略长时间的关联信息。

为了解决梯度消失问题,许多结构已经被提出来。其中包括长短时记忆单元(LSTM)递归神经网络。它在手写体识别以及音素分类问题上表现出色。LSTM拥有一个精密设计的结构,这种结构包含许多门。这些门控制着流向隐状态的信息的数量。这使得神经网络能记住长时间的信息。但是LSTM网络结构较复杂,这将会耗费更多的训练时间,而且容易在反向传播过程中出现梯度消失。为了解决这一问题,一种具有更简单结构的GRU结构被提出,这种结构相比LSTM更容易实现,训练也更简单。它的结构如图3所示。

现有的神经网络多标签分类不能够有效的学习样例的基本特征,实现结构复杂,并且反向传播时容易出现梯度消失问题。基于此,本发明提供一种基于GRU的递归神经网络多标签学习方法,该方法能充分利RNN获取样例的有效特征表示,提高多标签分类的准确率。GRU结构能有效地进行长时间记忆,它相比于LSTM结构更简单,并且反向传播时不容易出现梯度消失问题。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈工大机器人(合肥)国际创新研究院,未经哈工大机器人(合肥)国际创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810112481.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top