[发明专利]中毒样本生成方法、装置、设备及计算机可读存储介质有效
申请号: | 202010024362.X | 申请日: | 2020-01-09 |
公开(公告)号: | CN111259404B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 李洪伟;丁勇;姜文博;刘森;徐国文 | 申请(专利权)人: | 鹏城实验室 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06N3/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 晏波 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中毒 样本 生成 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明涉及计算机技术领域,公开了一种中毒样本生成方法、装置、设备及计算机可读存储介质。该中毒样本生成方法包括:获取待投毒模型和样本集,并对粒子群中各粒子的粒子参数进行初始化;基于初始化后的粒子和所述样本集对所述待投毒模型进行训练,并根据训练结果更新各粒子的粒子参数;基于更新后的粒子对所述待投毒模型进行迭代训练,以迭代更新各粒子的粒子参数;当达到预设迭代停止条件时,输出所述粒子群的目标全局最优极值;基于所述目标全局最优极值和所述样本集,生成中毒样本。本发明能够提高中毒样本的攻击效果。
技术领域
本发明涉及计算机技术领域,尤其涉及一种中毒样本生成方法、装置、设备及计算机可读存储介质。
背景技术
随着计算机技术的发展,近年来,随着技术的不断成熟和飞速发展,大量企业在机器学习领域取得了突破性进展。目前,机器学习系统逐渐在一些安全敏感任务中得到广泛的应用,如安全监控、入侵检测、恶意软件检测等。训练过程是机器学习的一个重要阶段,训练数据的质量对预测模型的好坏有着直接关系。然而,这一过程的安全性往往被忽略,因此,很多攻击者把针对机器学习模型的攻击重点放在了训练数据上。目前,最常见的攻击方法是投毒攻击,攻击者通过注入一些精心伪造的中毒数据样本使训练出的模型分类或者聚类精度降低,从而达到破坏训练模型的目的。
在投毒攻击过程中,最关键的步骤就是生成和优化中毒样本。现有的方案普遍采用梯度下降法来产生并优化中毒点,然而,梯度下降的优化算法往往会落入局部最优解,使得中毒样本对于机器学习模型的误导效果欠佳,即攻击效果较差。因此,如何提高中毒样本的攻击效果,是目前亟需解决的问题。
发明内容
本发明的主要目的在于提供一种中毒样本生成方法、装置、设备及计算机可读存储介质,旨在提高中毒样本的攻击效果。
为实现上述目的,本发明提供一种中毒样本生成方法,所述中毒样本生成方法包括:
获取待投毒模型和样本集,并对粒子群中各粒子的粒子参数进行初始化;
基于初始化后的粒子和所述样本集对所述待投毒模型进行训练,并根据训练结果更新各粒子的粒子参数;
基于更新后的粒子对所述待投毒模型进行迭代训练,以迭代更新各粒子的粒子参数;
当达到预设迭代停止条件时,输出粒子输出所述粒子群的目标全局最优极值;
基于所述目标全局最优极值和所述样本集,生成中毒样本。
可选地,所述样本集包括训练样本集和测试样本集,所述基于初始化后的粒子和所述样本集对所述待投毒模型进行训练,并根据训练结果更新各粒子的粒子参数的步骤包括:
基于初始化后的粒子和所述训练样本集对所述待投毒模型进行训练,得到训练好的待投毒模型;
将所述训练好的待投毒模型在所述测试样本集上进行测试,得到各粒子的适应度;
根据所述适应度更新各粒子的粒子参数。
可选地,所述根据所述适应度更新各粒子的粒子参数的步骤包括:
根据所述适应度确定所述粒子群的当前全局最优极值,并确定各粒子的当前个体最优极值;
根据所述当前全局最优极值和所述当前个体最优极值,更新各粒子的粒子参数。
可选地,所述粒子参数包括粒子位置和粒子速度,所述根据所述当前全局最优极值和所述当前个体最优极值,更新各粒子的粒子参数的步骤包括:
将所述当前全局最优极值、所述当前个体最优极值和所述初始化后的粒子的初始粒子速度,代入第一预设计算公式中进行计算,得到更新后的粒子速度;
将所述更新后的粒子速度和所述初始化后的粒子的初始粒子位置代入第二预设计算公式中进行计算,得到更新后的粒子位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹏城实验室,未经鹏城实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010024362.X/2.html,转载请声明来源钻瓜专利网。