[发明专利]基于差分隐私的噪声添加方法、装置、设备及介质有效

专利信息
申请号: 202110729784.1 申请日: 2021-06-29
公开(公告)号: CN113360945B 公开(公告)日: 2023-04-07
发明(设计)人: 韩玉奎;晏存;陈海涛;李福宇;高宏 申请(专利权)人: 招商局金融科技有限公司
主分类号: G06F21/62 分类号: G06F21/62;G06F16/2458;G06F16/26;G06F16/27;G06F18/214
代理公司: 深圳市沃德知识产权代理事务所(普通合伙) 44347 代理人: 高杰;于志光
地址: 518000 广东省深圳市福田区华富街*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 隐私 噪声 添加 方法 装置 设备 介质
【说明书】:

发明涉及数据隐私保护技术,揭露一种基于差分隐私的噪声添加方法,包括:利用数据样本集对预构建的数据挖掘模型进行第一预测训练,得到第一预测准确率,根据所述第一预测准确率设置所述数据挖掘模型的最低预测准确率,利用差分隐私技术,基于不同取值下的差分隐私预算ε构造有噪声的数据样本集,利用所述有噪声的数据样本集对所述数据挖掘模型进行第二预测训练,得到不同ε取值下的第二预测准确率,从不低于所述最低预测准确率的第二预测准确率中选择取值最小的ε对应的噪声作为目标噪声并添加至所述数据样本集中。本发明还提出一种基于差分隐私的噪声添加装置、设备及介质。本发明可以解决数据隐私保护中噪声选择普适性低的问题。

技术领域

本发明涉及数据隐私保护领域,尤其涉及一种基于差分隐私的噪声添加方法、装置、电子设备及计算机可读存储介质。

背景技术

随着信息技术应用的不段普及和深入,各种信息系统存储着大量的数据,例如,医疗机构建立的患者诊断数据集,商业机构建立的客户交易数据集。对这些数据集进行数据挖掘可以获得很多关键重要的信息,但是这些数据集通常包含着许多个人的隐私信息,例如,个人医疗诊断结果、个人消费习惯等信息,在对这些数据集进行数据挖掘、发布及共享的同时,可能会导致用户的个人隐私数据泄露,因此针对数据的隐私保护十分重要。

如何保护用户的个人隐私数据不泄露,当前针对数据的隐私保护较多是通过对原始数据集加入噪声,即通过在原始数据集中加入错误的数据来干扰攻击者,从而达到对原始数据集的隐私保护。这种方式噪声的设置非常关键,加入的噪声过小,不能起到隐私保护的作用,加入的噪声过大,可能会对原始数据集的逻辑造成干扰,导致相应的数据挖掘或数据分析的准确性下降,当前当前数据隐私保护中噪声选择依赖人工经验,噪声选择方法普适性有待提升。

发明内容

本发明提供一种基于差分隐私的噪声添加方法、装置及计算机可读存储介质,其主要目的在于解决当前数据隐私保护中噪声选择方法普适性低的问题。

为实现上述目的,本发明提供的一种基于差分隐私的噪声添加方法,包括:

利用数据样本集对预构建的数据挖掘模型进行第一预测训练,直到所述第一预测训练满足第一预设条件时,退出所述第一预测训练,并得到所述数据挖掘模型在满足所述第一预设条件时输出的第一预测准确率;

根据所述第一预测准确率,设置所述数据挖掘模型的最低预测准确率;

利用差分隐私技术,设置含有不同取值的差分隐私预算ε集,并根据每一个所述差分隐私预算ε的取值,对所述数据样本集加入噪声,得到不同ε取值下的有噪声的数据样本集;

利用所述不同ε取值下的有噪声的数据样本集,分别对所述数据挖掘模型进行第二预测训练,直到所述第二预测训练满足第二预设条件时,退出所述第二预测训练,并得到所述数据挖掘模型在满足所述第二预设条件时输出的不同ε取值下的第二预测准确率;

从所有所述不同ε取值下的第二预测准确率中选择不低于所述最低预测准确率的第二预测准确率,并从所有所述不低于所述最低预测准确率的第二预测准确率中,选择取值最小的ε对应的噪声作为目标噪声,将所述目标噪声添加至所述数据样本集中。

可选地,所述利用数据样本集对预构建的数据挖掘模型进行第一预测训练,直到所述第一预测训练满足第一预设条件时,退出所述第一预测训练,包括:

利用预构建的数据挖掘模型对所述数据样本集进行特征预测,得到所述数据样本集的特征集;

利用预构建的预测函数对所述特征集进行预测概率计算,得到所述数据样本集的第一预测结果;

根据所述数据样本集的真实结果及所述第一预测结果,计算得到所述数据样本集的第一预测准确率;

判断所述第一预测准确率是否满足第一预设条件;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于招商局金融科技有限公司,未经招商局金融科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110729784.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top