[发明专利]空时域脉冲神经网络训练方法、芯片及电子产品在审
申请号: | 202210174051.0 | 申请日: | 2022-02-24 |
公开(公告)号: | CN114565079A | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 菲利克斯·克里斯·琴鲍尔;赛义德·哈格哈特舒尔;格雷戈尔·伦茨;西克·萨迪克·尤艾尔阿明;乔宁;邢雁南;凌于雅 | 申请(专利权)人: | 深圳时识科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N3/06 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 李晨幼 |
地址: | 518026 广东省深圳市福田区福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时域 脉冲 神经网络 训练 方法 芯片 电子产品 | ||
1.一种空时域脉冲神经网络训练方法,该脉冲神经网络包括多个层,其特征在于,该方法包括如下步骤:
从训练数据集中接收一批样本数据,并将该一批样本数据作为脉冲神经网络的输入,运行该脉冲神经网络并获得脉冲神经网络的输出;
根据脉冲神经网络的输出,计算当前网络损失;
从脉冲神经网络的输出层为当前层开始,依照层的倒序,依次计算当前网络损失关于当前层与前一层之间的突触权重矩阵的梯度,直至当前网络损失关于输入扩张矩阵的梯度;
通过当前网络损失关于突触权重矩阵的梯度,更新脉冲神经网络的突触权重矩阵;
其中,在计算当前网络损失关于当前层与前一层之间的突触权重矩阵的梯度前:在每个时间步下,计算当前网络损失关于当前层的权重化的后突触输入的第二梯度;
并在计算以某个时间步为当前时间步的第二梯度前:基于当前层和当前时间步,带入代理梯度函数,将获得的代理梯度函数的值,作为当前时间步对应的第一变量的第一元素值;在计算当前时间步对应的第一变量的后一元素值时,基于当前时间步对应的第一变量的前一元素值,由此获得当前时间步对应的第一变量的全部元素值。
2.根据权利要求1所述的一种空时域脉冲神经网络训练方法,其特征在于:
所述第一变量的定义如下:
其中,为第l层网络在第n时间步对应的第一变量的一个元素值,是当前时间步对应的第一变量的第一元素值;v是不应期核;“*”是卷积操作;f′(l)[·]是第l层网络的代理梯度函数;l是当前层的序号。
3.根据权利要求2所述的一种空时域脉冲神经网络训练方法,其特征在于:
所述第二梯度的定义如下:
其中,d(l)[n]为第l层网络在第n时间步的第二梯度;∈是脉冲响应核;⊙为互相关操作;e(l)[·]是当前网络损失关于第l层网络输出脉冲响应信号的第一梯度;n为时间步序号,且n=1,2,…,T,其中T为时间步的总长度。
4.根据权利要求3所述的一种空时域脉冲神经网络训练方法,其特征在于:
所述第一梯度的定义如下:
当l=L时,
当l∈{1,…,L-1}时,e(l)[n]=d(l+1)[n]W(l);
其中,W(l)是第l层网络与第l+1层网络之间的突触权重矩阵;a(L)是第L层网络的输出脉冲序列与脉冲响应核卷积的结果;是当前网络损失。
5.根据权利要求4所述的一种空时域脉冲神经网络训练方法,其特征在于:
计算当前网络损失关于当前层与前一层之间的突触权重矩阵W(l-1)的梯度的方式为:
其中,为转置标记。
6.根据权利要求5所述的一种空时域脉冲神经网络训练方法,其特征在于:
在计算当前网络损失关于当前层与前一层之间的突触权重矩阵的梯度后,若l∈{2,…,L},则将网络的层反向前移一层,即将前移后的层作为当前层,并针对新的当前层,计算当前网络损失关于当前层与前一层之间的突触权重矩阵的梯度;若l=1,则通过网络损失关于突触权重矩阵的梯度,来更新网络突触权重矩阵。
7.根据权利要求1-6任意一项所述的空时域脉冲神经网络训练方法,其特征在于:所述脉冲神经网络中的神经元为LIF神经元或IAF神经元。
8.根据权利要求1-6任意一项所述的一种空时域脉冲神经网络训练方法,其特征在于:所述样本数据为视觉、听觉、触觉、嗅觉、心电、肌电、震动、IMU类型的信号中的一种或多种。
9.一种存储介质,该存储介质上存储有计算机代码,其特征在于:通过执行该计算机代码,以实现权利要求1-8任意一项所述的空时域脉冲神经网络训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳时识科技有限公司,未经深圳时识科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210174051.0/1.html,转载请声明来源钻瓜专利网。