[发明专利]基于最小均方误差准则的自适应隐私保护方法、装置及系统在审
申请号: | 202211578970.0 | 申请日: | 2022-12-05 |
公开(公告)号: | CN115879152A | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 宋海娜;武明虎;张凡;胡胜;熊炜;李利荣;万相奎;沈华;张明武 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/18 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 最小 误差 准则 自适应 隐私 保护 方法 装置 系统 | ||
1.基于最小均方误差准则的自适应隐私保护方法,其特征在于,包括:
数据聚合者接收本地端用户发送的隐私保护等级;
根据隐私保护等级对本地端用户进行分群,将具有相同隐私保护等级的用户划分到同一个子群体中;
根据本地化差分隐私技术和隐私保护等级确定最佳的扰动概率,基于最小均方误差准则,确定出两种经典本地化差分隐私技术的自适应边界,根据自适应边界选择最佳的数据扰动方式,并将自适应结果发送给对应的子群体中的用户,以使每个子群体中的用户采用对应的最佳的数据扰动方式对其隐私数据进行扰动处理,并采用最佳的扰动概率执行隐私保护操作,得到扰动后的数据,并发送给数据聚合者,其中,自适应结果包括最佳的数据扰动方式和最佳的扰动概率;
基于最小均方误差构建加权因子,对来自不同隐私保护等级下各子群体发送的扰动后的数据进行聚合,得到本地端用户隐私数据的统计估计。
2.如权利要求1所述的基于最小均方误差准则的自适应隐私保护方法,其特征在于,两种经典本地化差分隐私技术包括basic RAPPOR技术或k-RR技术,根据本地化差分隐私技术和隐私保护等级确定最佳的扰动概率,包括:
当采用的本地化差分隐私技术为basic RAPPOR技术时,在∈隐私保护等级下,针对二进制编码后隐私数据的每一个比特采用的最佳的扰动概率为:
其中,∈隐私保护等级;
当采用的本地化差分隐私技术为k-RR技术时,在∈隐私保护等级下,针对二进制编码后隐私数据的每一个比特采用的最佳的扰动概率为:
上式表示对隐私数据以p的概率保持原值,以(1-p)/的概率扰动输出其他k-1种的任意一种,k为不同隐私数据的个数。
3.如权利要求1所述的基于最小均方误差准则的自适应隐私保护方法,其特征在于,两种经典本地化差分隐私技术包括basic RAPPOR技术或k-RR技术,基于最小均方误差准则,确定出两种经典本地化差分隐私技术的自适应边界,包括:
基于最大似然估计准则计算采用basic RAPPOR技术时隐私分布的第一估计误差:
基于最大似然估计准则计算采用k-RR技术时隐私分布的第二估计误差:
其中,n表示数据量或用户个数,∈为隐私保护等级,也称为隐私预算,xi为第i种隐私数据,隐私数据xi的真实概率为Pi,k为不同隐私数据的个数,为第一估计误差,/为第二估计误差;
根据第一估计误差和第二估计误差确定出两种经典本地化差分隐私技术的自适应边界。
4.如权利要求3所述的基于最小均方误差准则的自适应隐私保护方法,其特征在于,根据第一估计误差和第二估计误差确定出两种经典本地化差分隐私技术的自适应边界,包括:
构建函数则ΔMSE的零点时的取值为:
其中,u和v的表达式为:
将∈*作为最小MSE准则下basic RAPPOR技术和k-RR技术的最佳自适应边界。
5.如权利要求1所述的基于最小均方误差准则的自适应隐私保护方法,其特征在于,基于最小均方误差构建加权因子,对来自不同隐私保护等级下各子群体发送的扰动后的数据进行聚合,得到本地端用户隐私数据的统计估计,包括:
基于最小均方误差的期望构建加权因子:
wτ为第τ个子群体的加权因子且满足l为计数符号,取值从1到m,MSEτ是第τ个子群体在隐私保护等级∈τ下的估计分布的均方误差值;
基于构建的加权因子对m个子群体中的扰动后的数据进行加权聚合,得到本地端用户隐私数据的统计估计:
其中,为针对第τ个子群体隐私数据的估计分布,m为子群体的总数,/为本地端用户隐私数据的统计估计。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211578970.0/1.html,转载请声明来源钻瓜专利网。