[发明专利]基于关联规则满足用户隐私保护的个性化推荐方法及系统有效
申请号: | 201410283430.9 | 申请日: | 2014-06-23 |
公开(公告)号: | CN104050267B | 公开(公告)日: | 2017-10-03 |
发明(设计)人: | 丁丽萍;卢国庆 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙)11200 | 代理人: | 冯艺东 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关联 规则 满足 用户 隐私 保护 个性化 推荐 方法 系统 | ||
技术领域
本发明属于信息技术、计算机技术领域,涉及数据挖掘方法,具体涉及一种差分隐私下的关联规则挖掘方法,并采用该方法实现个性化推荐系统,保证用户隐私的保护。
背景技术
个性化推荐系统是建立在海量数据挖掘基础上的一种高级智能平台,能够根据用户的兴趣特点和操作行为,向用户推荐感兴趣的信息和商品。以电子商务为例,电子商务网站(如亚马逊、淘宝等)为用户推荐商品,自动完成个性化选择商品的过程,满足用户的个性化需求。其中,基于关联规则的个性化推荐系统,是以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性,在零售业已经得到了成功的应用。然而关联规则挖掘过程中存在用户隐私泄露的风险,即关联规则本身的内容及其支持度计数有可能泄露用户的隐私信息。因此,如何在保护用户隐私的前提下,保证个性化推荐系统的可用性是一个值得深入研究的问题。
传统隐私保护模型下的个性化推荐系统大多基于K-匿名模型,然而当攻击者具备一定背景知识时,K-匿名模型就存在隐患。攻击者可以利用背景知识攻击、再识别攻击等攻击方法来确认用户隐私信息。此外,传统隐私保护模型无法定量分析其隐私保护水平。
差分隐私作为一种新的隐私保护模型,能够解决传统隐私保护模型的两大缺陷:(1)定义了一个相当严格的攻击模型,不关心攻击者拥有多少背景知识,即使攻击者已掌握除某一条记录之外的所有记录信息,该记录的隐私信息也无法被披露;(2)对隐私保护水平给出了严谨的定义和量化评估方法。因此,本发明应用差分隐私保护模型实现个性化推荐系统中用户隐私的保护。
发明内容
本发明针对已有方法的不足,提出一种差分隐私下的关联规则挖掘方法及采用该方法的个性化推荐系统,有效解决了用户隐私保护和提升个性化推荐系统性能之间的矛盾。
为实现上述目的,本发明采用如下技术方案:
一种差分隐私下的关联规则挖掘方法,其步骤包括:
(1)应用维规约技术得到原始数据的规约表示,并采用拉普拉斯机制或者指数机制保证规约过程满足ε1-差分隐私;
(2)应用闭频繁模式挖掘技术构建规约数据对应的前缀树,并利用拉普拉斯机制扰动频繁模式对应的支持度计数,保证满足ε2-差分隐私;同时利用一致性约束后置处理保证输出结果的可用性;
(3)挖掘前缀树,获得满足ε-差分隐私的频繁模式集合及其对应的支持度计数;
(4)应用关联规则发现算法,获得满足最小支持度和最小置信度,以及ε-差分隐私的强关联规则集合。
一种采用上述方法的满足用户隐私保护的个性化推荐方法,其步骤包括:
(1)获得一段时间内用户的历史行为数据;
(2)将用户的历史行为数据按照关联规则挖掘的需求进行预处理(包括数据清洗、去除噪声数据、数据格式转换等处理);
(3)采用上述差分隐私下的关联规则挖掘方法对预处理过的数据进行挖掘,生成关联规则集合;
(4)依据上述模块产生的关联规则数据生成推荐列表,帮助用户发现他们感兴趣的信息,并依据推荐列表为目标用户提供个性化的推荐服务。
一种采用上述方法的满足用户隐私保护的个性化推荐系统,包括:
数据采集模块,用于获得一段时间内用户的历史行为数据;
数据准备模块,用于将用户的历史行为数据按照关联规则挖掘的需求进行预处理(包括数据清洗、去除噪声数据、数据格式转换等处理);
规则挖掘模块,用于采用上述差分隐私下的关联规则挖掘方法对预处理过的数据进行挖掘,生成关联规则集合;
推荐系统模块,用于依据上述模块产生的关联规则数据生成推荐列表,帮助用户发现他们感兴趣的信息,并依据推荐列表为目标用户提供个性化的推荐服务。
本发明的个性化推荐系统中实现的用户隐私保护方法,是基于差分隐私交互式数据保护框架的隐私保护方法。通过综合应用差分隐私的噪音机制(例如,拉普拉斯机制和指数机制)、数据规约技术和闭频繁序列模式挖掘技术,实现了差分隐私下的关联规则挖掘方法,有效解决了关联规则本身的内容及其支持度计数有可能泄露用户隐私信息的问题,保证基于关联规则的个性化推荐系统中用户隐私的保护。本发明可广泛应用于电子商务、基于位置的服务、社交网络、音乐视频、广告等个性化推荐系统。
附图说明
图1是差分隐私保护模型下的个性化推荐系统流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410283430.9/2.html,转载请声明来源钻瓜专利网。