[发明专利]一种分布式环境下隐私保护的关联规则挖掘方法无效
申请号: | 201210589689.7 | 申请日: | 2012-12-29 |
公开(公告)号: | CN103150515A | 公开(公告)日: | 2013-06-12 |
发明(设计)人: | 薛安荣;刘峰 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F17/30 |
代理公司: | 江苏致邦律师事务所 32230 | 代理人: | 樊文红 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种分布式环境下隐私保护的关联规则挖掘方法,对多个数据方进行全局挖掘,包括构造项集随机干扰矩阵、对数据进行扰乱变换、统计扰乱后支持数矩阵之和、重构数据分布、精确计算剪枝后空间中的项集全局支持度等步骤。本发明的方法通过构造随机干扰矩阵对多个属性同时扰乱,扰乱过程中考虑属性之间相关性,从而有效地提高恢复精度;使用扰乱方法估算出项集的支持数后,根据最小支持度进行剪枝后再使用安全多方计算确定最终的全局频繁项集,从而有效减少了通信量,提高了挖掘效率,可以获取挖掘效率与挖掘精度之间较好的折衷,具有更广泛的应用范围。 | ||
搜索关键词: | 一种 分布式 环境 隐私 保护 关联 规则 挖掘 方法 | ||
【主权项】:
一种分布式环境下隐私保护的关联规则挖掘方法,该分布式环境下有多个数据方S1,…,Sn参与全局关联规则挖掘,该多个数据方构成k‑项集,其最小支持度为MST,最小置信度为MCT,每一数据方为一站点,其中数据方S1为主站点,S2,…,Sn为局部站点,其特征在于,该方法包括以下步骤:1)主站点S1根据k‑项集,构造项集随机干扰矩阵PL并发送给各局部站点;2)各局部站点根据PL干扰其所有的记录,然后统计干扰后的数据库中的k‑项集的支持数,并将它们构成支持数行矩阵发送给半诚信的第三方站点SP;3)半诚信第三方站点SP对各局部站点发送过来的所有项集支持数矩阵进行求和,得到求和后的支持数矩阵MS’,并将其发送给主站点S1;4)主站点S1使用PL的逆矩阵PL‑1来恢复MS’中各项集在原始数据中的支持计数MS,找出大于等于预定阈值(MST‑w)的近似全局频繁项集,其恢复公式为:MS=MS’·PL‑15)各站点根据安全多方计算方法,使用安全求和协议求出步骤4)得到的近似全局频繁项集的支持数;6)主站点S1根据步骤5计算得出近似全局频繁项集,使用关联规则挖掘算法Apriori迭代计算生成候选频繁(k+1)项集,直到全局频繁k‑项集的数目等于零,生成全局频繁项集的支持数;7)主站点S1根据全局频繁项集的支持数和MCT生成全局关联规则,并广播给各站点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210589689.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种具有宽带无线信号的消防应急灯装置
- 下一篇:带有电视显示屏的路灯灯杆