[发明专利]用于训练神经网络的方法及神经网络训练系统在审
申请号: | 201910223103.7 | 申请日: | 2019-03-22 |
公开(公告)号: | CN110414664A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 玻那·乔斯·哦拉都比;提塔许·瑞许特;乔治·亚德里安·凯特尔;莱恩·麦可·海雀 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N20/00;G06N3/08 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 刘培培;黄隶凡 |
地址: | 韩国京畿道水*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 神经网络训练 训练神经网络 一次迭代 迭代方式 输出 | ||
1.一种用于训练神经网络的方法,包括:
提供所述神经网络的至少一个可连续微分的模型,所述至少一个可连续微分的模型专用于所述神经网络的硬件;
使用所述至少一个可连续微分的模型以迭代方式训练所述神经网络,以为所述神经网络提供至少一个输出,每一次迭代均使用前一次迭代的至少一个输出以及所述至少一个可连续微分的模型中的当前可连续微分的模型。
2.根据权利要求1所述的方法,其中所述至少一个可连续微分的模型中的第一个可连续微分的模型是软件模型。
3.根据权利要求1所述的方法,其中所述神经网络的每一个当前可连续微分的模型比前一个可连续微分的模型提供对所述神经网络的所述硬件的更接近的近似。
4.根据权利要求1所述的方法,其中所述以迭代方式训练的步骤还包括:
使用所述至少一个输出来执行反向传播,以获得至少一个权重,所述至少一个权重用于下一次迭代。
5.根据权利要求4所述的方法,其中所述以迭代方式训练的步骤还包括:
如果所述至少一个权重相对于至少一个先前权重不大于至少一个阈值,则结束。
6.根据权利要求4所述的方法,其中所述可连续微分的模型是基于所述至少一个权重及所述以迭代方式训练的步骤的至少一个输入。
7.根据权利要求6所述的方法,其中所述以迭代方式训练的步骤的激活函数是所述当前可连续微分的模型、所述至少一个输入、所述当前可连续微分的模型的真实性参数及偏项的函数。
8.根据权利要求7所述的方法,其中所述以迭代方式训练的步骤还包括:
使用所述当前可连续微分的模型来确定所述偏项。
9.根据权利要求7所述的方法,其中所述以迭代方式训练的步骤还包括:
使用与所述当前可连续微分的模型不同的至少一个其他可连续微分的模型来确定所述偏项。
10.根据权利要求6所述的方法,其中所述神经网络利用至少一个离散的权重。
11.根据权利要求10所述的方法,其中所述至少一个可连续微分的模型中的每一者gn被表示为:
其中ω是权重,Δ是所述至少一个离散的权重的离散化步阶,ωsc是步阶之间的过渡尺度,εn是使所述至少一个可连续微分的模型中的所述每一者通过原点的偏移量,且σ是经拉伸的S型函数。
12.根据权利要求9所述的方法,其中所述经拉伸的S型函数被表示为σ=1/(1+e-ω/ωsc)。
13.根据权利要求1所述的方法,其中所述以迭代方式训练的步骤还包括:
在每一次迭代后,使用所述至少一个可连续微分的模型中的最末可连续微分的模型来验证至少一个权重。
14.根据权利要求13所述的方法,其中所述验证的步骤包括应用过程噪声模型。
15.根据权利要求1所述的方法,其中所述以迭代方式训练的步骤还包括:对至少一个激活及至少一个权重应用所述当前可连续微分的模型。
16.根据权利要求1所述的方法,其中所述以迭代方式训练的步骤对于所述神经网络而言是在芯片外进行的,所述方法还包括:
将至少一个最终输出提供到所述神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910223103.7/1.html,转载请声明来源钻瓜专利网。