[发明专利]一种隐私保护的生成模型构建方法在审
申请号: | 202210539948.9 | 申请日: | 2022-05-18 |
公开(公告)号: | CN114943101A | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 王绍蔚;钟裕森;邹旺文;杨蕊琳 | 申请(专利权)人: | 广州大学 |
主分类号: | G06F21/71 | 分类号: | G06F21/71;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 广州高炬知识产权代理有限公司 44376 | 代理人: | 孙明科 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 隐私 保护 生成 模型 构建 方法 | ||
1.一种隐私保护的生成模型构建方法,其特征在于,其包括如下步骤:
基于与生成器相对,用于判别生成器生成数据的真假概率的判别器;
用于学习每个客户端的数据类别的判断的大模型教师判别器;
基于通过教师判别器的引导来学习各客户端的共同规律进行判别的小模型学生判别器;
用于生成模拟真实数据的样本的生成器;
基于多个样本组成的数据集合的数据集;
隐私预算:隐私预算越高,隐私损失越大,而单次查询预算越小,在预算范围内可以查询的次数就越多;
基于去偏判别器蒸馏的差分隐私数据生成器;
所述的服务器端,该服务器是指网络中能对其它机器提供某些服务的计算机系统,具体为与客户端的通讯;
所述的客户端,是指与服务器相对应,为客户提供本地服务的程序。
2.根据权利要求1所述的隐私保护的生成模型构建方法,其特征在于:其中,所述基于去偏判别器蒸馏的差分隐私数据生成器的方法,包括以下步骤:
步骤1:服务器端初始化学生判别器和生成器G0,所有客户端模型初始化为百分比参数β,迭代次数T,假样本数量s,有益样本数量r,隐私参数(ε,δ),生成器Gt-1;
步骤2:对m个客户端进行T轮迭代:从G0生成的数据中抽取s个组成每个客户端都用自己的数据集Di和来训练,每个客户端对的判断结果发送给服务器;
步骤3:服务器端用有益样本选择的方法,把该轮生成的数据抽取一部分,组成并用上隐私预算参数
步骤4:中的样本,保存教师判别器的判别结果,用差分隐私的β百分比评估器组成用和作为训练数据集,用交叉熵损失来作为损失函数训练学生判别器并更新为,进而使用学生判别器训练生成器(更新Gt-1的参数,并更新为Gt)。
3.根据权利要求2所述的隐私保护的生成模型构建方法,其特征在于:其步骤3中的有益样本选择方法中,对的每一次的训练具体流程如下:
步骤3.1:设为空集,设阈值Λ=0.2m;计数count设为0,k=Laplace(2/ε);Noise=Laplace(2/ε);
步骤3.2:将m个教师判别器对的判别结果组成集合Vx;对于满足的样本x,添加到同时count加1,更新k=Laplace(2/ε);
步骤3.3:直到count大于阈值s或者遍历完所有样本,返回
4.根据权利要求1所述的隐私保护的生成模型构建方法,其特征在于:所述教师判别器对生成数据x的打分,用设定条件来限制其聚合结果,具体限制方式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210539948.9/1.html,转载请声明来源钻瓜专利网。