[发明专利]神经网络中关键攻击路径的确定方法和装置在审
申请号: | 202010888524.4 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112183716A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 刘艾杉;刘祥龙;李恬霖 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京汲智翼成知识产权代理事务所(普通合伙) 11381 | 代理人: | 陈曦;陈琳 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 关键 攻击 路径 确定 方法 装置 | ||
1.一种神经网络中关键攻击路径的确定方法,其特征在于包括如下步骤:
将各普通样本输入至神经网络,待神经网络各层输出后,执行如下操作得到样本级别的关键攻击单元:
根据神经网络的损失函数,从神经网络最后一层的各神经元中找到最后一层的关键攻击单元;
基于神经网络前一层中各神经元对后一层的关键攻击单元的影响力,得到前一层的关键攻击单元;
针对各普通样本输入,逐层聚合每一层的样本级别的关键攻击单元,得到模型级别的神经网络关键攻击路径。
2.如权利要求1所述的神经网络中关键攻击路径的确定方法,其特征在于,所述根据神经网络的损失函数,从神经网络最后一层的各神经元中找到最后一层的关键攻击单元,具体包括:
求出损失函数对最后一层的各神经元的梯度;
选取前k个符合预定标准梯度的神经元作为最后一层的关键攻击单元。
3.如权利要求2所述的神经网络中关键攻击路径的确定方法,其特征在于,所述梯度的表达式为:
公式(1)中,表示神经网络的损失函数,ZLm表示神经网络最后一层L的第m个神经元的输出,表示损失函数对神经元m的梯度。
4.如权利要求3所述的神经网络中关键攻击路径的确定方法,其特征在于,所述最后一层的关键攻击单元的表达式为:
公式(2)中,gL表示神经网络最后一层L上所有神经元的梯度,FL表示神经网络的最后一层,top-k(·)表示根据预定标准从集合中挑选k个元素。
5.如权利要求1所述的神经网络中关键攻击路径的确定方法,其特征在于,所述基于神经网络前一层中各神经元对后一层的关键攻击单元的影响力,得到前一层的关键攻击单元,具体包括:
针对神经网络的第l-1层的第i个神经元:
计算第l-1层第i个神经元对第l层某一关键攻击单元的输出中某一元素的影响力;
将第l-1层第i个神经元对第l层某一关键攻击单元的输出中各元素的影响力相加,得到第l-1层第i个神经元对第l层某一关键攻击单元的影响力;
从第l-1层中各神经元对第l层各关键攻击单元的影响力中选取前k个符合预设标准影响力的神经元作为第l-1层的关键攻击单元。
6.如权利要求5所述的神经网络中关键攻击路径的确定方法,其特征在于,所述第l-1层第i个神经元对第l层某一关键攻击单元的输出中某一元素的影响力的表达式为:
公式(3)中,表示第l-1层第i个神经元的输出对第l层关键攻击单元j的输出中z元素的影响力。
7.如权利要求6所述的神经网络中关键攻击路径的确定方法,其特征在于,所述第l-1层第i个神经元对第l层某一关键攻击单元的影响力的表达式为:
公式(4)中,表示第l-1层第i个神经元对第l层关键攻击单元j的输出中所有元素的影响力。
8.如权利要求7所述的神经网络中关键攻击路径的确定方法,其特征在于,所述第l-1层的关键攻击单元的表达式为:
公式(5)中,top-k(·)表示根据预设标准从集合中挑选k个元素,Fl表示神经网络的第l层,表示第l-1层第i个神经元对第l层各关键攻击单元的影响力,表达式为:
公式(6)中,Flj表示神经网络第l层的第j个攻击单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010888524.4/1.html,转载请声明来源钻瓜专利网。