[发明专利]神经网络参数初始化的方法和装置在审

专利信息
申请号: 201811072803.2 申请日: 2018-09-14
公开(公告)号: CN110909860A 公开(公告)日: 2020-03-24
发明(设计)人: 杨宁 申请(专利权)人: 华为技术有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08
代理公司: 北京龙双利达知识产权代理有限公司 11329 代理人: 时林;毛威
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 神经网络 参数 初始化 方法 装置
【说明书】:

本申请提供了人工智能领域中的一种神经网络参数初始化的方法及装置。该方法包括:为所述神经网络的每一局部网络分别确定与之对应的特征训练集,基于该多个特征训练集分别训练多个局部网络,该多个局部网络中每个局部网络覆盖神经网络中的一部分,并将训练完成的该多个局部网络的参数的全部或者部分作为神经网络初始化参数。本申请提供的技术方案通过训练多个局部网络得到神经网络初始化参数,能够提高神经网络的收敛速度和参数初始化性能。

技术领域

本申请涉及人工智能领域,并且更具体地,涉及一种神经网络参数初始化的方法和装置。

背景技术

神经网络的研究分化为两个方向。其中,一个研究方向专注于生物信息处理的过程,称为生物神经网络;另一个研究方向专注于工程应用,称为人工神经网络。直到2006年深度网络(deep network)和深度学习(deep learning)概念的提出,神经网络又开始焕发一轮新的生命。

深度神经网络(deep neural networks,DNN)是指深度神经网算法,是近几年在工业界和学术界新型的一个机器学习领域的流行话题。DNN算法成功的将以往人工神经网络的识别率提高了一个显著的档次。

目前深度神经网络作为机器学习的热点之一,可以学习训练数据高层次的抽象特征义特征。近年来深度神经网络已经在图像处理、语音识别、文本分类等方面得到了很好的验证和应用。具体地,神经网络起源于上世纪40年代,神经网络可以实现一些逻辑运算的功能。

在利用反向传播算法对深度神经网络进行的训练的过程中,由于深度神经网络的网络层数众多,极易出现梯度消失或者梯度爆炸。因此,神经网络参数的初始化显得至关重要,好的神经网络参数初始化的方法,有利于提升神经网络参数初始化的性能和训练神经网络的收敛速度。

现有技术中的,在深度神经网络参数初始化时采用随机化方法以及迁移学习的方法,导致训练深度神经网络时收敛速度慢以及深度神经网络参数初始化的性能差。因此,如何提高训练神经网络的收敛速度和神经网络参数初始化的性能成为亟待解决的问题。

发明内容

本申请提供一种神经网络参数初始化的方法和装置,能够提高训练神经网络的收敛速度和神经网络参数初始化的性能。

第一方面,提供了一种神经网络参数初始化的方法,包括:为所述神经网络的每一局部网络分别确定与之对应的特征训练集,其中,所述神经网络包括多个局部网络,所述多个局部网络中的每个局部网络覆盖所述神经网络的一部分;对每一局部网络分别使用与之对应的特征训练集训练以得到该局部网络的参数;确定所述神经网络的初始化参数,其中,所述神经网络的初始化参数包括:所述多个局部网络的参数的全部或部分。

根据本申请实施例提供的神经网络参数初始化的方法,通过为多个局部网络确定多个特征训练集,基于局部网络对应的特征训练集分别训练多个局部网络,并将训练完成的局部网络中的参数的全部或部分参数作为所述神经网络的初始化参数。由于,上述的多个局部网络中的每个局部网络覆盖所述神经网络的一部分,相当于对神经网络的多个部分分别进行参数初始化,能够提高训练神经网络的收敛速度和神经网络参数初始化的性能。

应理解,上述将训练完成的多个局部网络的参数作为神经网络的初始化参数为:多个局部网络中每个局部网络覆盖神经网络的一部分,在该局部网络训练完成后,该局部网络的参数作为对应的覆盖部分的神经网络的参数。

其中,每个局部网络覆盖神经网络的一部分指的是该局部网络为神经网络中的一部分。

结合第一方面,在第一方面的某些实现方式中,所述确定所述神经网络的初始化参数包括:所述神经网络的第一部分的初始化参数为第一局部网络集合中,最后一个训练完成的局部网络的参数的全部或部分,所述第一局部网络集合包括一个或多个训练完成的局部网络,所述一个或多个训练完成的局部网络覆盖所述神经网络的第一部分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811072803.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top