[发明专利]基于奇异值分解的本地差分隐私保护的频繁项集挖掘方法在审
申请号: | 202110556455.1 | 申请日: | 2021-05-21 |
公开(公告)号: | CN113407986A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 董恺;池平川 | 申请(专利权)人: | 南京逸智网络空间技术创新研究院有限公司;东南大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/9035;G06F17/16 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 陆烨 |
地址: | 210012 江苏省南京市雨花台区大周*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 奇异 分解 本地 隐私 保护 频繁 挖掘 方法 | ||
1.基于奇异值分解的本地差分隐私保护的频繁项集挖掘方法,其特征在于:具体包括如下步骤:
步骤1:对智能家居用户持有的项目的频次进行估计,将频次按照由大到小排列,选择频次排名前K的项目作为频繁项目并依次编号;
步骤2:将用户分成K组,并将步骤1中选择的K个频繁项目进行两两组合,每一组为一个频繁项目集合,根据频繁项目集合建立K*K维的初始矩阵M;设置初始的频繁项集组FIS,此时FIS为空;
步骤3:令k=1;
步骤4:对M进行奇异值分解,得到两个正交矩阵U和VT;服务器将U和VT发送给第k组用户;
步骤5:第k组用户中的第r个用户根据收到的U和VT、FIS和该用户持有的频繁项目,建立与第r个用户对应的奇异矩阵,对该奇异矩阵进行干扰,得到干扰信息,并将该干扰信息上传至服务器,r=1,2,…,R,R为第k组用户中用户的总个数;
步骤6:服务器对收到的R个干扰信息进行聚合分析,从而挖掘出最频繁的频繁项目集合,放入FIS中,并将M中与FIS中频繁项目集合对应的元素的值设置为0;
步骤7:令k=k+1,判断k是否大于K,若是则停止计算,将FIS作为挖掘结果;否则返回步骤4。
2.根据权利要求1所述的基于奇异值分解的本地差分隐私保护的频繁项集挖掘方法,其特征在于:所述步骤1具体为:将智能家居用户分为三组,第一组的每个用户随机选择一个项目进行干扰,并将干扰信息上传至服务器,服务器对第一组用户发送的干扰信息进行聚合分析,从而得到频次排名为前2*K的项目,这些项目构成候选项目集合;服务器将候选项目集合发送至第二组用户,第二组的每个用户计算自身拥有的项目构成的集合与候选项目集合的交集,并将其中的项目个数作为数据进行干扰,并将干扰信息上传至服务器,服务器对第二组用户发送的干扰信息进行聚合恢复,从而得到抽样数,服务器将抽样数和候选项目集合发送至第三组用户;第三组的每个用户计算自身拥有的项目构成的集合与候选项目集合的交集J,若J中的项目个数小于抽样数,则在J中添加虚拟项目,使得J中项目的个数等于抽样数,第三组中的每个用户从自身拥有的项目构成的集合与候选项目集合的交集中随机选择一个项目进行干扰,并将干扰信息上传至服务器,服务器对第三组用户发送的干扰信息进行聚合恢复,从而得到所有用户持有的项目的频次估计。
3.根据权利要求1所述的基于奇异值分解的本地差分隐私保护的频繁项集挖掘方法,其特征在于:所述步骤2中根据第i个频繁项目和第j个频繁项目组成的频繁项目集合,计算得到矩阵M中第i行第j列的元素的值:
m(i,j)=min(f(i),f(j))
其中,min(.)为最小值函数,f(i)为第i个频繁项目的频次,f(j)为第j个频繁项目的频次,i=1,2,…,K,j=1,2,…,K。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京逸智网络空间技术创新研究院有限公司;东南大学,未经南京逸智网络空间技术创新研究院有限公司;东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110556455.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种金属制品铸造用水冷装置
- 下一篇:跨域QoS调整方法和装置