[发明专利]一种对抗样本攻击的防御方法、装置及电子设备有效

专利信息
申请号: 202010610929.1 申请日: 2020-06-29
公开(公告)号: CN111783085B 公开(公告)日: 2023-08-22
发明(设计)人: 李卓蓉;封超;吴明晖;颜晖;朱凡微;金苍宏 申请(专利权)人: 浙大城市学院
主分类号: G06F21/55 分类号: G06F21/55;G06N3/04;G06N3/094
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 应孔月
地址: 310015 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 对抗 样本 攻击 防御 方法 装置 电子设备
【权利要求书】:

1.一种对抗样本攻击的防御方法,其特征在于,包括:

获取原始样本并进行预处理;

根据深度神经网络分类模型和预处理后的样本生成对抗样本;

输入原始样本和对抗样本,分别获得原始样本和对抗样本基于所述深度神经网络分类模型的表征;

对原始样本和对抗样本的表征进行匹配;

以表征匹配误差为正则项构建目标函数,实施防御训练;

对待测样本进行预处理;

将所述预处理后的待测样本输入至防御训练后的深度神经网络分类模型中,输出分类结果;

其中,对原始样本和对抗样本的表征进行匹配,包括:

匹配可形式化表示为:

其中,表示表征匹配误差项,j表示预设层,和分别表示原始样本和对抗样本在深度神经网络分类模型的预设层j的表征,是范数取值;

其中,以表征匹配误差为正则项构建目标函数,包括:

根据下式构建目标函数:

其中,表示训练集服从分布,是深度神经网络分类模型的损失函数,和分别是表征匹配误差项Lfm和深度神经网络分类模型参数的正则项Lnorm的权重;Lnorm能有效避免深度神经网络分类模型发生过拟合现象,其公式化表示为:,其中,n表示样本数量。

2.如权利要求1所述的方法,其特征在于,获取原始样本并进行预处理,包括:

利用随机信号对原始样本进行翻转;

对翻转后的样本进行缩放;

对缩放后的样本进行裁剪;

对裁剪后的样本进行归一化。

3.如权利要求1所述的方法,其特征在于,根据深度神经网络分类模型和预处理后的样本生成对抗样本,包括:

通过下式,生成对抗样本:

,

其中,表示对抗样本,下标t+1和t分别表示第t+1次和第t次迭代,α表示步长,是符号函数,x表示原始样本,S表示有效的对抗扰动幅值,表示将像素值投影至有效取值范围的投影算子,是交叉熵损失函数,表示深度神经网络分类模型的交叉熵损失函数对的每个像素点求负梯度,表示样本真正类别,表示深度神经网络分类模型的参数。

4.如权利要求3所述的方法,其特征在于,所述对抗样本的初始值如下:

,

其中,表示像素值的最大扰动幅值,表示和原始样本x尺寸相同的、取值范围在(-1,1)内的随机向量。

5.如权利要求1所述的方法,其特征在于,所述表征包括原始样本和对抗样本在所述深度神经网络分类模型的预设层的激活特征图。

6.如权利要求1所述的方法,其特征在于,实施防御训练,包括:

将所述原始样本与所述对抗样本一起作为所述深度神经网络分类模型的防御训练数据集;

根据防御训练数据集,通过最小化目标函数对所述深度神经网络分类模型进行训练。

7.如权利要求1所述的方法,其特征在于,对待测样本进行预处理,包括:

对待测样本进行归一化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙大城市学院,未经浙大城市学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010610929.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top