首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种提升深度学习模型鲁棒性的训练方法及系统在审

申请号：	201910599177.0	申请日：	2019-07-04
公开（公告）号：	CN110674937A	公开（公告）日：	2020-01-10
发明（设计）人：	刘祥龙;刘艾杉;于航;张崇智	申请（专利权）人：	北京航空航天大学
主分类号：	G06N3/08	分类号：	G06N3/08;G06N3/04
代理公司：	11381 北京汲智翼成知识产权代理事务所(普通合伙)	代理人：	陈曦;陈丽
地址：	100190***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经元噪音鲁棒性正向传播隐藏层对抗学习计算复杂度存储单元迭代执行反向传播实际场景训练过程自然噪音传统的应用性正整数正向样本存储取出更新应用保证
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种提升深度学习模型鲁棒性的训练方法，其特征在于包括如下步骤：

S1，在模型反向传播时，计算得到模型每一隐藏层神经元所需的对抗噪音，并进行存储；

S2，在模型正向传播时，从噪音存储单元中取出神经元对应的对抗噪音，更新隐藏层神经元值，并继续正向传播；

S3，迭代执行上述步骤S1和步骤S2共P轮，完成提升深度学习模型鲁棒性的训练；其中P为正整数。

2.如权利要求1所述的提升深度学习模型鲁棒性的训练方法，其特征在于在模型反向传播时，计算得到模型每一隐藏层神经元所需的对抗噪音，并进行存储，包括如下步骤：

在模型反向传播时，根据链式法则，依次求导得到损失函数对于每一隐藏层神经元的对抗梯度；

将每个神经元所需的对抗噪声保存在神经元对应的噪音存储单元中。

3.如权利要求2所述的提升深度学习模型鲁棒性的训练方法，其特征在于：

所述根据链式法则，依次求导得到损失函数对于每一隐藏层神经元的对抗梯度采用如下公式：

其中，g^m.t表示第t轮迭代第m层隐藏层的z_m的对抗梯度；z^m，t表示第t轮迭代第m层隐藏层神经元的输出。

4.如权利要求2所述的提升深度学习模型鲁棒性的训练方法，其特征在于所述根据损失函数对于每一隐藏层神经元的对抗梯度，结合动量信息得到每一神经元所需的对抗噪音；采用如下公式：

其中，ε表示每一轮对抗梯度的步幅大小，k表示迭代的次数，(1-η)为衰减率，g^m.t表示第t轮迭代第m层隐藏层的z_m的对抗梯度；r^m，t为第t轮迭代第m层隐藏层神经元的对抗噪声。

5.如权利要求1所述的提升深度学习模型鲁棒性的训练方法，其特征在于在模型正向传播时，从噪音存储单元中取出神经元对应的对抗噪音，更新隐藏层神经元值，并继续正向传播，包括如下步骤：

在正向传播过程中，计算得到前一层每个神经元的激活函数值a^m-1，t；

在正向传播过程中，计算每个神经元的激活函数；

从噪音存储单元中取出神经元对应的对抗噪音；

在模型执行至仿射变换计算出每层输入之后，在每层输入中加入对应的对抗噪音；

将第t轮迭代第m层神经元的输出z^m，t输入到激活函数，通过激活函数计算激活函数值并继续正向传播。

6.如权利要求5所述的提升深度学习模型鲁棒性的训练方法，其特征在于针对一个神经网络，在前向传播时，通过仿射变换计算每层输入，采用如下计算公式：

z^m，t＝a^m-1，tw^m-1+b^m-1；

其中，z^m，t为第t轮迭代第m层神经元的输出；a^m-1，t为第t轮迭代第m-1层神经元的激活函数；w^m-1是第m-1层神经元的仿射变换矩阵；b^m-1是第m-1层神经元的仿射变换偏置。

7.如权利要求1所述的提升深度学习模型鲁棒性的训练方法，其特征在于：

训练过程分为三个阶段，每个阶段产生不同的对抗噪音参数；在每个阶段，对抗噪音参数η和ε保持固定大小。

8.如权利要求7所述的提升深度学习模型鲁棒性的训练方法，其特征在于：

阶段1为零对抗噪音；超参数取值：ε为0，k为1，所述阶段1持续p₁轮；

阶段2为大对抗噪音；超参数取值：ε取值较大，k取值较小，所述阶段持2续p₂轮；

阶段3为小对抗噪音；超参数取值：ε取值较小，k取值较大，所述阶段3持续p₃轮；

其中，p₁、p₂、p₃均为正整数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京航空航天大学，未经北京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910599177.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种神经网络处理方法、装置、计算机设备及存储介质
下一篇：基于协同多任务训练的对抗攻击防御方法

同类专利

专利分类

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top