[发明专利]一种神经网络训练方法和装置有效
申请号: | 201710459806.0 | 申请日: | 2017-06-16 |
公开(公告)号: | CN109146073B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 姚骏;刘武龙;汪玉;夏立雪 | 申请(专利权)人: | 华为技术有限公司;清华大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/063 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 训练 方法 装置 | ||
1.一种神经网络训练方法,其特征在于,应用于阻变存储器(Resistive RandomAccess Memory,RRAM)上,所述方法包括:
将神经网络中第r层的神经元输入值ri1、ri2……rin输入到所述RRAM中,根据所述RRAM中的过滤器(filter)对所述神经元输入值ri1、ri2……rin进行计算,得到所述神经网络中第r层的神经元输出值ro1、ro2……rom,其中,n为大于0的正整数,m为大于0的正整数;
根据所述RRAM的核值、所述神经网络中第r层的神经元输入值ri1、ri2……rin、所述神经网络中第r层的神经元输出值ro1、ro2……rom以及所述神经网络中第r层的反向传播误差值B1、B2……Bm进行计算,得到所述神经网络中第r层的反向传播更新值C1、C2……Cm;其中,所述RRAM的核值为所述RRAM中的过滤器的矩阵值,所述神经网络中第r层的反向传播误差值B1、B2……Bm是根据所述神经网络第r层的神经元输出值ro1、ro2……rom和所述神经网络第r层的神经元参考输出值rt1、rt2……rtm得到的;
将所述神经网络中第r层的反向传播更新值C1、C2……Cm与预设阈值进行比较,当所述神经网络中第r层的反向传播更新值C1、C2……Cm大于所述预设阈值,则
根据所述神经网络中第r层的反向传播更新值C1、C2……Cm对所述RRAM中的过滤器进行更新。
2.如权利要求1所述的方法,其特征在于,所述预设阈值为静态阈值或动态阈值;当所述预设阈值为静态阈值时,所述神经网络中所有层级的预设阈值的值相同,当所述预设阈值为动态阈值时,所述神经网络中不同层级的预设阈值的值不同或部分不同。
3.如权利要求1或2所述的方法,其特征在于,对所述RRAM进行错误测试,输出所述RRAM的硬错误分布图,根据所述RRAM的硬错误分布图对所述神经网络进行数据重排。
4.如权利要求3所述的方法,其特征在于,所述根据所述RRAM的硬错误分布图对所述神经网络进行数据重排包括:将所述神经网络的稀疏数据排布到所述RRAM上恒为0的硬错误区域。
5.如权利要求3所述的方法,其特征在于,所述对所述RRAM进行错误测试,输出所述RRAM的硬错误分布图包括:
对所述RRAM中各个单元分别写入测试值,将所述各个单元的测试值与所述各个单元的实际读出值分别进行比较,得到所述RRAM中各个单元的硬错误情况,所述RRAM中各个单元的硬错误情况构成所述RRAM的硬错误分布图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;清华大学,未经华为技术有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710459806.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于卷积神经网络加速器的数据重用方法
- 下一篇:图像对象识别