[发明专利]推荐系统的个性化隐私保护方法及系统在审
申请号: | 201810316810.6 | 申请日: | 2018-04-10 |
公开(公告)号: | CN108628955A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 曹娟;上官建峰;王佳臣;李锦涛 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/62 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评分项目 集合 评分数据 推荐系统 替换 虚拟用户 隐私保护 相似度 预设 个性化 个人隐私 反馈 | ||
本发明涉及一种推荐系统的个性化隐私保护方法,包括:获取所有用户的评分项目i以形成评分项目集合R;计算该评分项目i两两之间的相似度;以评分项目集合R中用户A的评分项目j形成评分项目集合RA;获得该用户A对评分项目集合RA的评分数据集D;根据预设的相似度阈值,在评分项目集合R中选取评分项目j的替换项目j';根据预设的个人隐私系数,将评分项目j全部或部分替换为替换项目j',形成虚拟用户A'的评分项目集合RA';以评分数据集D作为虚拟用户A'对评分项目集合RA'的评分数据集D',通过该推荐系统获得推荐结果,并反馈给该用户A。
技术领域
本发明属于网络安全领域,特别涉及一种基于项目相似度替换的推荐系统个性化隐私保护方法。
背景技术
随着互联网技术的飞速发展,互联网上的信息量呈爆炸式增长,面对繁多的数据,用户通常需要借助推荐系统来进行数据的筛选,个性化的选择出用户个人所需要的信息。然而,随着对推荐系统的依赖逐渐增加,因推荐系统而造成用户隐私泄漏的情况也日益严重。
在Netflix公布的数据集中,Calandrino等人发现,仅仅通过8部电影的评分与允许14天的评分日期误差就可以唯一识别数据集中98%的用户,而用户一旦被锁定,其联系方式、家庭住址、政治取向、性取向以及交友关系等一系列个人信息都将被获取。因此研究推荐系统中的隐私保护方法是十分必要的。
在现有研究中,Zhu等人首先将差分隐私方法引入到基于K近邻的推荐算法中,在差分隐私的框架下进行隐私的邻居选择并据此进行推荐,该方法可以有效地抵制基于相似用户的攻击,但其计算复杂度较高且数据可用性低,因此在实际中应用较少。Arnaud等人提出了差分隐私保护的矩阵分解方法,在利用矩阵分解方法进行推荐的算法下,该方法分别在用户评分数据和随机梯度下降过程中引入满足差分隐私条件的噪声扰动,使得推荐结果具备隐私保护能力,但该方法存在引入噪声过大的问题,推荐结果准确度较低。
发明人在进行推荐系统中的隐私保护研究时,发现现有结合了隐私保护技术的推荐系统均存在着推荐结果准确度低的问题,这种缺陷是由向数据中注入的噪声过多所造成的。对用户数据不加区分的引入噪声会使用户个人历史评分数据出现很多与个人偏好不一致的评分项目,使得推荐结果准确度降低。
发明内容
针对上述问题,本发明提出一种推荐系统的个性化隐私保护方法,包括:
获取所有用户的评分项目i以形成评分项目集合R;计算该评分项目i两两之间的相似度;以评分项目集合R中用户A的评分项目j形成评分项目集合RA;获得该用户A对评分项目集合RA的评分数据集D;根据预设的相似度阈值,在评分项目集合R中选取评分项目j的替换项目j';根据预设的个人隐私系数,将评分项目j全部或部分替换为替换项目j',形成虚拟用户A'的评分项目集合RA';以评分数据集D作为虚拟用户A'对评分项目集合RA'的评分数据集D',通过该推荐系统获得推荐结果,并反馈给该用户A。
本发明所述的个性化隐私保护方法,通过以下方式获得评分项目i两两之间的相似度:
相似度其中,和分别为所有对评分项目i1和评分项目i2评分所得的评分数据向量,i1、i2∈i,i1≠i2;
或,相似度其中,I为同时对评分项目i1和评分项目i2进行评分的用户的集合,和分别为用户u对i1和i2的评分项目合集,和分别为所有i1和i2的评分的平均值,i1、i2∈i,i1≠i2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810316810.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种海量数据自助查询方法和装置
- 下一篇:产品创新设计的方法及系统