[发明专利]一种基于强化学习的隐私保护移动群智感知方法有效
申请号: | 202110727758.5 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113553614B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 林晖;胡嘉;汪晓丁;妙秦阳 | 申请(专利权)人: | 福建师范大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/64;G06F16/27 |
代理公司: | 福州市博深专利事务所(普通合伙) 35214 | 代理人: | 林振杰 |
地址: | 350000 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 隐私 保护 移动 感知 方法 | ||
1.一种基于强化学习的隐私保护移动群智感知方法,其特征在于,包括:
S1、基于激励机制进行KL隐私保护的数据聚合;
步骤S1中,所述数据聚合的聚合数据 是通过第
;
步骤S1包括:
S11、每个所述参与用户端
;
其中;
因此将上述公式一改写为:
;
S12、计算聚合精度半径,所述聚合精度半径表示从真实平均值到计算结果的偏差:
;
所述聚合精度半径由权重和隐私保护度表示为:
;
其中,,计算结果收敛于中的真正平均值;
S2、基于假设检验进行数据可靠性验证;
所述步骤S2中采用的数据可靠性验证公式为零和博弈,所述零和博弈通过假设检验来实现,最优检验预支通过强化学习来学习得到,具体为:
S21、将表示为零假设,即数据是可靠的,反之,表示数据不可靠,则可靠的数据被误判为不可靠的数据的误报率:
;
S22、将数据可靠性验证的所述零和博弈的纳什均衡表示为,阈值用于在数据可靠性验证中使效用最大化,而恶意参与用户端的目标是使其效用最大化;
所述零和博弈的唯一纳什均衡由下式给出:
;
其中,为预设的阈值:
;
且方程由求解;
上传的每个数据都由维度2的实部和虚部组成,因此有:
;
;
其中,和分别是具有2个自由度的非中心参数的卡方分布和非中心卡方分布的累积分布函数;
S3、采用强化学习算法进行用户信誉更新和聚合权重计算;
所述步骤S3采用强化学习算法Sarsa,具体为:
S31、设置信誉更新规则如下:
对
若,则信誉值随着的增加而降低;
信誉更新函数为:
;
其中在范围与上时,是负实数;
表示每个数据和参考值之间的绝对偏差,,而表示每个可靠数据和参考值之间的绝对偏差,,参数和由诚实的参与用户端或恶意参与用户端的信誉值由预设方式评估得到,且初始值均为0.5;
S32、让表示经过数据可靠性检验验证过的可靠数据集;因此,数据的聚合权重由下式给出:
;
其中:
。
2.根据权利要求1所述的一种基于强化学习的隐私保护移动群智感知方法,其特征在于,
所述一种基于强化学习的隐私保护移动群智感知方法用于不可信的聚合中心,其中的参与用户端包括诚实客户端与恶意客户端。
3.根据权利要求1所述的一种基于强化学习的隐私保护移动群智感知方法,其特征在于,
每个参与用户端上传至融合中心的数据均为通过KL隐私进行扰动后的数据。
4.根据权利要求1所述的一种基于强化学习的隐私保护移动群智感知方法,其特征在于,
每个参与用户端的隐私成本定义为:
其中成本参数是一个非负实数,为隐私保护度。
5.根据权利要求1所述的一种基于强化学习的隐私保护移动群智感知方法,其特征在于,
所述激励机制公式如下:
;
;
最优隐私保护度和奖励由融合中心的预算B、成本参数和参与用户端数n决定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建师范大学,未经福建师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110727758.5/1.html,转载请声明来源钻瓜专利网。