[发明专利]一种分布式环境下隐私保护的关联规则挖掘方法无效

专利信息
申请号: 201210589689.7 申请日: 2012-12-29
公开(公告)号: CN103150515A 公开(公告)日: 2013-06-12
发明(设计)人: 薛安荣;刘峰 申请(专利权)人: 江苏大学
主分类号: G06F21/60 分类号: G06F21/60;G06F17/30
代理公司: 江苏致邦律师事务所 32230 代理人: 樊文红
地址: 212013 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 分布式 环境 隐私 保护 关联 规则 挖掘 方法
【说明书】:

技术领域

发明涉及数据挖掘中隐私保护技术领域,具体而言涉及一种分布式环境下隐私保护的关联规则挖掘方法。

背景技术

信息时代带来了数据的爆炸性增长,也催生了从海量数据中提取出有用知识的富有挑战性的研究领域――数据挖掘。数据挖掘作为一个强有力的数据分析工具,可以发现数据中潜在的模式和规律(如:决策树、聚类、关联规则、神经网络或其它方式表示的知识),在商务决策、生物医疗和科学研究等领域扮演着非常重要的角色,具有广泛的应用前景。然而,传统的数据挖掘技术直接在原始数据集上进行,会引起隐私数据的泄露。例如,疾病控制中心从各医疗机构收集病人的病例信息,以进行疾病的分析与控制。在这个过程中,传统数据挖掘技术不可避免地暴露敏感数据,如病人所患疾病,而这些敏感数据是数据所有者(医疗机构、病人)不希望被揭露的。企业间的数据共享能给企业带来巨大的利益,但每个企业数据集中都蕴涵着大量的敏感知识,它们的泄露,可能给商业上的竞争者带来可乘之机。

通过数据挖掘可以预测未来趋势及行为,可以发现两个或多个事物之间存在某种关联关系,帮助决策者调整市场策略,减少风险,做出正确的决策,增加企业利润。然而考虑到隐私问题,人们往往不愿意将自己的信息提供给数据挖掘者或提供虚假的信息,企业也可能不愿意提供自己的真实信息给数据挖掘者以防止泄露企业内部机密或失去市场竞争力,从而可能挖掘出错误的知识,使得决策者做出错误的决策,不利于社会进步。而只有在隐私得到保护的情况,个人或企业才愿意提供相关的信息。因此,隐私保护技术的出现就是为了解决上述问题,如何在各种数据库应用中保护数据的隐私,成为近年来学术界的研究热点。

分布式环境下的隐私保护关联规则挖掘需要保护的隐私内容有原始数据信息和各数据方的关联规则信息。目前已有的方法主要有:安全多方计算(SMC:Secure Multi-party Computation)和数据扰乱(data obscuration)。安全多方计算,采用基于比特的公钥加密技术来管理大量候选频繁项集,从中搜索出频繁项集,算法复杂度较高、效率太低、通信量太大;基于扰乱的隐私保护技术能够快速地实现数据扰乱和重构,但由于对单个属性进行干扰,破坏了属性之间的相关性,导致挖掘精度下降。

发明内容

针对现有技术中存在的问题和不足,本发明旨在提供一种分布式环境下隐私保护的关联规则挖掘方法,采用安全多方计算与随机干扰相结合的方法,即混合方法来实现对隐私信息的有效保护,并且扰乱方法采用的是对多个属性同时扰乱,能够有效保持属性之间的相关性,提高挖掘精度;安全多方计算只用来计算剪枝后的项集支持数,可以减少通信量和计算量,从而可以获取挖掘精度与挖掘效率之间较好的平衡。

本发明的上述目的通过独立权利要求的技术特征实现,从属权利要求以另选或有利的方式发展独立权利要求的技术特征。

为达成上述目的,本发明提出一种分布式环境下隐私保护的关联规则挖掘方法,该分布式环境下有多个数据方S1,…,Sn参与全局关联规则挖掘,该多个数据方构成k-项集,其最小支持度为MST,最小置信度为MCT,每一数据方为一站点,其中数据方S1为主站点,S2,…,Sn为局部站点,该方法包括以下步骤:

1)主站点S1根据k-项集,构造项集随机干扰矩阵PL并发送给各局部站点;

2)各局部站点根据PL干扰其所有的记录,然后统计干扰后的数据库中的k-项集的支持数,并将它们构成支持数行矩阵发送给半诚信的第三方站点SP;

3)半诚信第三方站点SP对各局部站点发送过来的所有项集支持数矩阵进行求和,得到求和后的支持数矩阵MS’,并将其发送给主站点S1

4)主站点S1使用PL的逆矩阵PL-1来恢复MS’中各项集在原始数据中的支持计数MS,找出大于等于预定阈值(MST-w)的近似全局频繁项集,其恢复公式为:

MS=MS’·PL-1

5)各站点根据安全多方计算方法,使用安全求和协议求出步骤4)得到的近似全局频繁项集的支持数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210589689.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top