[发明专利]一种基于采样的差分隐私保护方法和系统在审
申请号: | 201910975518.X | 申请日: | 2019-10-15 |
公开(公告)号: | CN110727957A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 周世杰;廖永建;黄文;向麟;陈鼎伟;胡凤仙;王鹤鸣;黄铭 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 51214 成都九鼎天元知识产权代理有限公司 | 代理人: | 管高峰 |
地址: | 611731 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 隐私保护 临时数据库 查询请求 查询 原始数据库 混淆 答案返回 个人用户 海量数据 接收查询 数据特征 数据形成 数据噪声 随机采样 答案 统计分析 采样 数据库 | ||
1.一种基于采样的差分隐私保护方法,其特征在于,包括如下步骤:
步骤1,收集个人用户的数据形成原始数据库;
步骤2,对原始数据库中的数据进行随机采样得到临时数据库;
步骤3,接收查询用户的查询请求q;
步骤4,根据查询请求q涉及数据的数据特征选择差分隐私保护机制;
步骤5,在临时数据库中运行选择的差分隐私保护机制,使差分隐私保护机制在临时数据库中查询查询请求q的真实答案;
步骤6,利用数据噪声混淆所述真实答案;
步骤7,将混淆后的真实答案返回给查询用户。
2.根据权利要求1所述的基于采样的差分隐私保护方法,其特征在于,步骤1中收集的个人用户的数据为用户敏感信息。
3.根据权利要求1所述的基于采样的差分隐私保护方法,其特征在于,步骤2中对原始数据库中的数据进行随机采样得到临时数据库的方法为:设定采样概率P,然后对原始数据库中的数据进行随机采样,使得每个用户提交的每一条数据出现在临时数据库中的概率为P。
4.根据权利要求1所述的基于采样的差分隐私保护方法,其特征在于,步骤4中根据数据特征选择差分隐私保护机制的方法为:
(1)对数值型的数据,选择拉普拉斯机制;
(2)对类别型数据,选择指数机制。
5.根据权利要求3所述的基于采样的差分隐私保护方法,其特征在于,步骤4中选择差分隐私保护机制后,根据隐私保护强度的需要选择隐私保护预算ε。
6.一种基于采样的差分隐私保护系统,其特征在于,包括:
数据收集模块;所述数据收集模块用于收集个人用户的数据;
数据采样模块;所述数据采样模块用于对原始数据库中的数据进行随机采样得到临时数据库;
接收模块;所述接收模块用于接收查询用户的查询请求q;
差分隐私选择模块;所述差分隐私模块用于根据查询请求q涉及数据的数据特征选择差分隐私保护机制;
差分隐私查询模块;所述差分隐私查询模块用于在临时数据库中运行选择的差分隐私保护机制,使差分隐私保护机制在临时数据库中查询查询请求q的真实答案;
数据混淆模块;所述数据混淆模块用于利用数据噪声混淆所述真实答案;
应答模块;所述应答模块用于将混淆后的真实答案返回给查询用户。
7.根据权利要求6所述的基于采样的差分隐私保护系统,其特征在于,所述数据收集模块收集的个人用户的数据为用户敏感信息。
8.根据权利要求6所述的基于采样的差分隐私保护系统,其特征在于,所述差分隐私保护系统包括第一系统参数设定模块;所述第一系统参数设定模块用于设置采样概率P;则所述数据采样模块对原始数据库中的数据进行随机采样,使得每个用户提交的每一条数据出现在临时数据库中的概率为P 。
9.根据权利要求6所述的基于采样的差分隐私保护系统,其特征在于,所述差分隐私选择模块根据查询请求q涉及数据的数据特征选择差分隐私保护机制的方法为:
(1)对数值型的数据,选择拉普拉斯机制;
(2)对类别型数据,选择指数机制。
10.根据权利要求6所述的基于采样的差分隐私保护系统,其特征在于,所述差分隐私保护系统包括第二系统参数设定模块;所述第二系统参数设定模块用于在所述差分隐私选择模块选择差分隐私保护机制后,根据隐私保护强度的需要选择隐私保护预算ε。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910975518.X/1.html,转载请声明来源钻瓜专利网。