[发明专利]一种基于训练过程解构的后门攻击防御方法及系统在审

专利信息
申请号: 202111312806.0 申请日: 2021-11-08
公开(公告)号: CN114003909A 公开(公告)日: 2022-02-01
发明(设计)人: 黄坤哲;吴保元;李一鸣;秦湛;任奎 申请(专利权)人: 深圳市大数据研究院;香港中文大学(深圳)
主分类号: G06F21/56 分类号: G06F21/56;G06K9/62;G06N3/04;G06N3/08
代理公司: 西安迪业欣知识产权代理事务所(普通合伙) 61278 代理人: 校丽丽
地址: 518172 广东省深圳市龙岗*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 训练 过程 解构 后门 攻击 防御 方法 系统
【说明书】:

发明公开了一种基于训练过程解构的后门攻击防御方法及系统,属于神经网络安全技术领域,能够解决现有防御模型对正常测试数据的预测结果准确率较低的问题。所述方法包括:获取包含有后门毒化数据的含标签训练样本集;对含标签训练样本集进行去标签处理,得到无标签训练样本集,并将无标签训练样本集输入神经网络模型中进行特征提取层训练;将含标签训练样本集输入神经网络模型中进行简单分类层训练,得到训练后模型;利用训练后模型对测试数据集进行类别预测。本发明用于后门攻击的防御。

技术领域

本发明涉及一种基于训练过程解构的后门攻击防御方法及系统,属于神经网络安全技术领域。

背景技术

随着科学技术的不断发展,深度神经网络模型当前被成功地应用于许多和安全相关的系统上,如人脸识别、自动驾驶和恶意软件检测等。随着模型规模的扩大,它们对数据的需求也在不断增长。为实现最先进的性能,用户往往会通过自动化或者外包的方式来收集足够的训练数据。这些缺乏可信赖的人工监督所采集的数据,使得模型极容易遭受后门攻击。在后门攻击中,攻击者在干净数据上添加后门触发器得到毒化数据,模型在训练后便被注入后门。含有后门的模型在正常的测试数据上表现良好,而会将添加上后门触发器的测试数据分类为攻击者指定的目标类别。因此,后门攻击不仅难以被人察觉而且会对系统造成重大的威胁。

目前后门攻击方法可以根据目标标签的性质分为毒化标签攻击与干净标签攻击。毒化标签攻击是目前最主流的攻击方法。现有技术中也有一些防御方法来缓解后门攻击威胁,现有的防御大多是经验性的,主要可分为五大类,包括:(1)基于检测的防御会检查模型或者测试样本是否被攻击,如果被攻击则对其拒绝使用;(2)基于预处理的防御试图破坏测试样本中潜在的后门触发器来避免激活模型中潜在的后门;(3)基于模型重构的防御通过对模型进行修改来直接破坏其中隐藏的后门;(4)基于触发器合成的防御通过逆向模型中潜在的触发器模式来进一步消除其中后门的影响;(5)基于毒化抑制的防御则在训练过程中对毒化数据的有效性进行抑制来避免后门的生成。其中,第五类防御,主要通过在训练数据以及模型梯度中添加噪声,来破坏触发器和目标标签的强对应关系,但是在降低攻击成功率的同时,也会影响模型在正常测试数据的准确率。

发明内容

本发明提供了一种基于训练过程解构的后门攻击防御方法及系统,能够解决现有防御模型对正常测试数据的预测结果准确率较低的问题。

一方面,本发明提供了一种基于训练过程解构的后门攻击防御方法,所述方法包括:

步骤1、获取包含有后门毒化数据的含标签训练样本集;

步骤2、对所述含标签训练样本集进行去标签处理,得到无标签训练样本集,并将所述无标签训练样本集输入神经网络模型中进行特征提取层训练;

步骤3、将所述含标签训练样本集输入所述神经网络模型中进行简单分类层训练,得到训练后模型;

步骤4、利用所述训练后模型对测试数据集进行类别预测。

可选的,在步骤3后,所述方法还包括:

步骤5、获取所述含标签训练样本集中每个样本的训练损失值,并根据所述每个样本的训练损失值和预设阈值将所述含标签训练样本集分为高置信度数据集和低置信度数据集;

步骤6、对所述低置信度数据集进行去标签处理,并利用所述高置信度数据集和去标签的低置信度数据集矫正所述训练后模型,得到矫正后模型;

相应的,所述步骤4具体为:

利用所述矫正后模型对测试数据集进行类别预测。

可选的,所述将所述无标签训练样本集输入神经网络模型中进行特征提取层训练,具体包括:

将所述无标签训练样本集输入神经网络模型中,采用自监督学习方法进行特征提取层训练。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市大数据研究院;香港中文大学(深圳),未经深圳市大数据研究院;香港中文大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111312806.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top