[发明专利]数据攻击的防御方法及其模型的训练方法、系统在审
申请号: | 202111181473.2 | 申请日: | 2021-10-11 |
公开(公告)号: | CN113901514A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 陆韵;郑申俊;江易;孙云;舒塘皓;周龙;吕添;姚世凯 | 申请(专利权)人: | 杭州中奥科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 安卫静 |
地址: | 310000 浙江省杭州市拱墅*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 攻击 防御 方法 及其 模型 训练 系统 | ||
1.一种用于数据攻击防御的模型训练方法,其特征在于,所述方法包括:
获取样本图像数据集;其中,所述样本图像数据集至少包括:MNIST数据集和ImageNet数据集;
将所述样本图像数据集输入至预设的深度学习模型中进行训练;其中,所述深度学习模型包括:第一目标模型和/或第二目标模型;所述MNIST数据集用于所述第一目标模型的训练;所述ImageNet数据集用于所述第二目标模型的训练;
通过预设的损失函数分别对所述第一目标模型和/或所述第二目标模型的损失值进行计算;当所述第一目标模型的损失值和/或所述第二目标模型的损失值满足预设的损失阈值时,得到用于数据攻击防御的初始模型;
利用重要性判别函数对已得到的所述初始模型中的权重进行剪枝操作,并将已完成剪枝操作的所述初始模型确定为所述用于数据攻击防御的模型。
2.根据权利要求1所述的模型训练方法,其特征在于,利用重要性判别函数对已得到的所述初始模型中的权重进行剪枝操作,包括:
利用掩码矩阵对所述初始模型进行约束,并根据约束结果确定所述初始模型中的权重的重要性数据;
利用所述重要性判别函数,对已确定的所述权重的重要性数据进行判别,并根据判别结果对所述初始模型中的权重进行剪枝操作。
3.根据权利要求2所述的模型训练方法,其特征在于,利用掩码矩阵对所述初始模型进行约束,并根据约束结果确定所述初始模型中的权重的重要性数据,通过以下算式计算得到:
其中,Wk为所述初始模型,k为所述初始模型的第k层;Tk为二值的掩码矩阵,当Tk=0时表示对应的权重已被剪枝,当Tk=1时表示对应的权重未被剪枝;L为所述初始模型的损失函数;β为所述初始模型的学习率;
利用所述重要性判别函数,对已确定的所述权重的重要性数据进行判别,并根据判别结果对所述初始模型中的权重进行剪枝操作,通过以下算式计算得到:
其中,hk为所述重要性判别函数,用于判断对应的权重是否重要;所述重要性判别函数,如下:
其中,ak和bk分别为第一阈值和第二阈值,且akbk。
4.根据权利要求1所述的模型训练方法,其特征在于,将所述样本图像数据集输入至预设的深度学习模型中进行训练的步骤,包括:
根据所述第一目标模型和/或所述第二目标模型的模型结构,确定所述深度学习模型训练时的超参数;
利用已确定的所述超参数,对所述深度学习模型进行训练;其中,所述深度学习模型进行训练时采用SGD、Adam上述一种或多种优化器进行优化。
5.根据权利要求4所述的模型训练方法,其特征在于,通过预设的损失函数分别对所述第一目标模型和/或所述第二目标模型的损失值进行计算的步骤,包括:
根据交叉熵函数确定所述损失函数;其中,所述损失函数为:
其中,p为所述样本图像数据集中的样本的真实标签;q为预测的概率;xi为所述样本图像数据集中的样本;w为模型参数;λ为正则化系数;Loss为损失函数;
利用所述损失函数,计算所述第一目标模型的损失值和/或所述第二目标模型的损失值。
6.一种数据攻击的防御方法,其特征在于,所述方法包括:
获取待检测的图像数据;
将所述图像数据输入至已完成训练的防御模型,输出所述图像数据的置信度检测结果;其中,所述防御模型通过上述权利要求1至5任一项所述的模型训练方法训练得到;
根据所述置信度检测结果确定所述图像数据的攻击风险值,并将所述攻击风险值大于预设阈值的所述图像数据进行数据防御;其中,所述数据防御针对的是成员推理攻击的防御。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州中奥科技有限公司,未经杭州中奥科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111181473.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置