[发明专利]一种程序化噪声对抗样本攻击的防御方法在审
申请号: | 202210644774.2 | 申请日: | 2022-06-08 |
公开(公告)号: | CN115358382A | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 丁勇;唐呈俊;李振宇;杨炳年 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N20/20;G06F21/50 |
代理公司: | 桂林文必达专利代理事务所(特殊普通合伙) 45134 | 代理人: | 张学平 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 程序化 噪声 对抗 样本 攻击 防御 方法 | ||
本发明涉及人工智能安全技术领域,具体涉及一种程序化噪声对抗样本攻击的防御方法,包括使用训练数据集对神经网络模型进行训练,得到预训练模型;使用程序性噪声对抗样本对训练数据集进行扰动,得到扰动数据集;使用扰动数据集对得到预训练模型进行训练,得到对抗样本微调模型;在对抗样本微调模型中添加程序性造成扰动,得到噪声扰动模型,利用集成学习算法模型将噪声扰动模型与原始对抗模型结合,得到防御方法,解决了现有的对抗训练方法无法对程序性噪声对抗样本进行防御的问题。
技术领域
本发明涉及人工智能安全技术领域,尤其涉及一种程序化噪声对抗样本攻击的防御方法。
背景技术
对抗样本攻击是一种利用特定算法对神经网络输入图片进行微小扰动从而使神经网络输出产生较大改变的攻击模式。
现有的针对于对抗样本攻击的对抗训练方法将对抗样本标记为正确的标签后对网络进行重新训练,以达到防御效果。
程序性噪声对抗样本作为一种新型的对抗样本攻击方法,能够使上述现有的防御方法均失效,降低了输入图片的安全性。
发明内容
本发明的目的在于提供一种程序化噪声对抗样本攻击的防御方法,旨在解决现有的对抗训练方法无法对程序性噪声对抗样本进行防御的问题。
为实现上述目的,本发明提供了一种程序化噪声对抗样本攻击的防御方法,包括以下步骤:
S1使用训练数据集对神经网络模型进行训练,得到预训练模型;
S2使用程序性噪声对抗样本对所述训练数据集进行扰动,得到扰动数据集;
S3使用所述扰动数据集对得到预训练模型进行训练,得到对抗样本微调模型;
S4在所述对抗样本微调模型中添加程序性造成扰动,得到噪声扰动模型;
S5利用集成学习算法模型将所述噪声扰动模型与原始对抗模型结合,得到防御方法。
其中,所述使用训练数据集对神经网络模型进行训练,得到预训练模型的具体方式为:
S11对神经网络模型进行初始化,得到初始化模型;
S12通过学习率为0.001的优化器使用训练数据集对所述初始化模型进行训练,得到预训练模型。
其中,所述使用程序性噪声对抗样本对所述训练数据集进行扰动,得到扰动数据集的具体方式为:
S21设定程序性噪声函数;
S22在所述程序性噪声函数中搜索噪声参数,得到对抗样本;
S23使用所述对抗样本对所述训练数据集的任意样本进行扰动;
S24循环步骤S21至S23,直至所述训练数据集的所有样本均被扰动,得到扰动数据集。
其中,所述使用所述扰动数据集对得到预训练模型进行训练,得到对抗样本微调模型的具体方式为:
通过学习率为0.0001的优化器使用所述扰动数据集对所述优化模型进行训练,得到对抗样本微调模型。
其中,所述利用集成学习算法模型将所述噪声扰动模型与原始对抗模型结合,得到防御方法的具体方式为:
S51对原始神经网络模型进行训练,得到原始对抗模型;
S52基于所述原始对抗模型构建集成学习算法模型;
S53对所述集成学习算法模型进行训练,得到集成优化模型;
S54使用所述集成优化模型将噪声扰动模型与所述原始对抗模型结合,得到防御方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210644774.2/2.html,转载请声明来源钻瓜专利网。