[发明专利]基于学习自动机的深度神经网络优化方法在审
申请号: | 201710054653.1 | 申请日: | 2017-01-24 |
公开(公告)号: | CN106951959A | 公开(公告)日: | 2017-07-14 |
发明(设计)人: | 李生红;郭浩楠;马颖华;任栩蝶;汤璐 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 上海交达专利事务所31201 | 代理人: | 王毓理,王锡麟 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 自动机 深度 神经网络 优化 方法 | ||
1.一种基于学习自动机的深度神经网络优化方法,其特征在于,在深度神经网络的训练阶段,从全连接的初始网络结构出发,在通过梯度下降迭代更新参数的过程中不断找到网络中的弱连接并将其去除,从而得到更为稀疏连接、具有更小的泛化误差的网络结构,以便用于对测试样本进行更高精度的图像分类,所述的弱连接,通过LA在训练过程中不断与神经网络交互而进行判定。
2.根据权利要求1所述的方法,其特征是,所述的弱连接,其判定具体为:通过对神经网络中的每一个连接,分别分配一个LA对当前连接的强弱进行判定,即:采用具有两个行为α1和α2的FSSA模型,其中:行为α1对应判定当前连接为强连接,α2对应判定当前连接为弱连接;每个行为对应N个内部状态,即LA共有2N个状态,记为L2N,N,其中:N代表记忆深度;该学习自动机的输出函数为:当时刻t处于状态q(t)=qi,1≤i≤N,则输出α1,即判定当前连接为强连接;当处于状态q(t)=qi,N+1≤i≤2N,则输出α2,即判定当前连接为弱连接。
3.根据权利要求1所述的方法,其特征是,所述的与神经网络交互是指:当当前连接权重大于阈值时,对当前LA进行奖励,否则,对LA进行惩罚:在没有任何先验知识的情况的初始时刻下,LA处于状态q1;经过一次迭代过程中,当LA得到奖励,则向判定为强连接的状态移动,即从当前状态qi转移到qi-1,当i=1则保持原状态;当LA得到惩罚,则向判定为弱连接的状态移动,即从当前状态qi转移到qi+1,当i=2N则保持原状态不变。
4.根据权利要求1所述的方法,其特征是,所述的去除是指:在前向传播时把当前权重置零;并且在反向传播过程中把当前权重的梯度置零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710054653.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型高效节能混铁车罐体
- 下一篇:一种钢水包结构