[发明专利]一种用于执行全连接层神经网络训练的装置和方法有效
申请号: | 201811221576.5 | 申请日: | 2016-04-29 |
公开(公告)号: | CN109376861B | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 郭崎;张士锦;陈云霁;陈天石 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/063;G06N3/04 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种用于执行人工神经网络全连接层反向训练的装置,包括指令存储单元、控制器单元、数据访问单元、互连模块、主运算模块、以及多个从运算模块。使用该装置可以实现人工神经网络全连接层的反向训练。对于每一层来说,首先对输入梯度向量进行加权求和计算出本层的输出梯度向量。该输出梯度向量乘以下一层在正向运算时的激活函数的导数值可以得到下一层的输入梯度向量。将输入梯度向量与正向运算时的输入神经元对位相乘得到本层权值的梯度,然后可以根据所得到的本层权值的梯度来更新本层的权值。 | ||
搜索关键词: | 一种 用于 执行 连接 神经网络 训练 装置 方法 | ||
【主权项】:
1.一种用于执行人工神经网络全连接层反向训练的装置,所述装置用于执行人工神经网络全连接层反向训练的指令;所述装置包括指令存储单元、控制器单元、直接内存访问单元、互连模块、主运算模块、从运算模块,其中:直接内存访问单元,用于执行数据的读写操作,从外部存储空间读取指令;指令缓存单元,用于缓存指令;控制器单元,用于从指令存储单元读取指令,并将该指令译码成控制互连模块、主运算模块、以及所述从运算模块行为的控制信号;所述互连模块,用于连接主运算模块和从运算模块;主运算模块,用于依据该控制信号将上一层的输出神经元梯度向量乘以本层激活函数导数得到输入神经元梯度向量,通过互连模块向从运算模块传输本层的输入神经元梯度向量;从运算模块,用于计算输入神经元梯度向量与权值矩阵中该从运算模块对应列的乘积,得到本层输出神经元梯度向量部分和;互连模块,用于依据从运算模块的输出神经元梯度向量部分和得到本层的输出神经元梯度向量;主运算模块,在下一层的计算过程中,利用本层的输出神经元梯度向量完成后续计算;从运算模块,还用于将输入神经元梯度向量与该从运算模块对应的输入神经元数据计算得到本层的权值梯度;主运算模块,用于对本层的权值梯度进行处理得到本层的第二权值梯度,依据第二权值梯度进行本层权值的更新。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811221576.5/,转载请声明来源钻瓜专利网。