[发明专利]基于关联规则满足用户隐私保护的个性化推荐方法及系统有效
申请号: | 201410283430.9 | 申请日: | 2014-06-23 |
公开(公告)号: | CN104050267B | 公开(公告)日: | 2017-10-03 |
发明(设计)人: | 丁丽萍;卢国庆 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙)11200 | 代理人: | 冯艺东 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关联 规则 满足 用户 隐私 保护 个性化 推荐 方法 系统 | ||
1.一种差分隐私下的关联规则挖掘方法,其步骤包括:
(1)应用维规约技术得到原始数据的规约表示,并采用拉普拉斯机制或者指数机制保证规约过程满足ε1-差分隐私;
(2)应用闭频繁模式挖掘技术构建规约数据对应的前缀树,并利用拉普拉斯机制扰动频繁模式对应的支持度计数,保证满足ε2-差分隐私;同时利用一致性约束后置处理保证输出结果的可用性;
(3)挖掘前缀树,获得满足ε-差分隐私的频繁模式集合及其对应的支持度计数;其中ε=ε1+ε2;
(4)应用关联规则发现算法,获得满足最小支持度和最小置信度,以及ε-差分隐私的强关联规则集合。
2.根据权利要求1所述方法,其特征在于:步骤(1)应用维规约技术和差分隐私的拉普拉斯机制或者指数机制,获得原始数据集的规约表示及规约后的最大记录长度,满足差分隐私保护。
3.根据权利要求1所述方法,其特征在于,步骤(1)所述拉普拉斯机制为:对于任一个函数f:D→Rd,若算法K的输出结果满足下列等式,则K满足ε-差分隐私保护,
K(D)=f(D)+<Lap1(Δf/ε),…,Lapd(Δf/ε)>
其中,Lapi(Δf/ε)(1≤i≤d)是相互独立的拉普拉斯变量,对应概率密度函数为p(x|b)=(1/2b)exp(-|x|/b);噪音大小与Δf成正比,与ε成反比,即全局敏感性越大,所添加噪音越大。
4.根据权利要求1所述方法,其特征在于,步骤(1)所述指数机制为:给定一个打分函数u:(D×O)→R,若算法K满足下列等式,则K满足ε-差分隐私保护,
其中,Δu为打分函数u(D,r)的全局敏感性,r表示从输出域O中所选择的输出项,打分越高,被选择输出的概率越大。
5.根据权利要求1所述方法,其特征在于:步骤(4)所述关联规则发现算法,首先找出所有的频繁模式及其支持度计数,然后由频繁模式产生强关联规则,所述频繁模式的支持度计数满足预定义的最小支持度计数阈值。
6.一种采用权利要求1所述方法的满足用户隐私保护的个性化推荐方法,其步骤包括:
(1)获得一段时间内用户的历史行为数据;
(2)将用户的历史行为数据按照关联规则挖掘的需求进行预处理;
(3)采用权利要求1所述差分隐私下的关联规则挖掘方法对预处理过的数据进行挖掘,生成关联规则集合;
(4)依据步骤(3)产生的关联规则数据生成推荐列表,并依据推荐列表为目标用户提供个性化的推荐服务。
7.一种采用权利要求6所述方法的基于用户隐私保护的个性化推荐系统,其包括:
数据采集模块,用于获得一段时间内用户的历史行为数据;
数据准备模块,用于将用户的历史行为数据按照关联规则挖掘的需求进行预处理;
规则挖掘模块,用于采用权利要求1所述差分隐私下的关联规则挖掘方法对预处理过的数据进行挖掘,生成关联规则集合;
推荐系统模块,用于依据规则挖掘模块产生的关联规则数据生成推荐列表,并依据推荐列表为目标用户提供个性化的推荐服务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410283430.9/1.html,转载请声明来源钻瓜专利网。