[发明专利]一种基于标签和差分隐私保护的推荐方法在审
申请号: | 201910062956.7 | 申请日: | 2019-01-23 |
公开(公告)号: | CN109784092A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 蒋宗礼;张秀英;董璇 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/9535 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 隐私保护 模糊 聚类 噪声 数据可用性 常规聚类 聚类过程 欧式距离 用户隐私 准确度 兴趣度 准确率 向量 隐私 引入 | ||
本发明提供一种基于标签和差分隐私保护的推荐方法,本方法旨在引入标签概念,通过标签的共现原则计算标签的相似性,使用标签相似性代替模糊c均值聚类的欧式距离对标签进行模糊c均值聚类,使其属于不同聚类,解决由常规聚类的硬聚类问题导致推荐准确率低的问题,并在聚类过程中加入符合Laplace分布的噪声达到保护用户隐私的目的。通过对标签进行模糊c均值聚类更解决了直接向标签兴趣度向量中加入噪声导致数据可用性降低的问题,在提高推荐准确度的同时保护了用户的隐私。
技术领域
网络信息的搜索与处理领域,特别是一种基于标签和差分隐私保护的推荐方法。
背景技术
随着信息技术和数据挖掘技术的迅猛发展,信息呈爆炸式增长,个性化推荐算法也得到了广泛的发展和应用;其中使用最广泛的效果最好的当属协同过滤算法,基于用户的协同过滤基于项目的协同过滤,这些都是基于用户评分矩阵来进行相似度计算,但是仍面临着数据稀疏性的问题,当评分数据稀疏时很难得到相似用户,推荐质量也会随之下降。上述问题的主要原因就是数据量不够,需要更多的合适且容易获取的数据信息来计算。Web2.0时代社会化网络中的重要应用就是标签的使用,标签体现了用户对资源的理解,不仅表达了用户对资源的理解还充分的反映了资源的特征,作为用户和资源之间的纽带,客观反映用户和用户之间的关系和共识度,丰富了评分数据不足的问题。但由于个性化推荐系统收集了大量的用户信息进行兴趣模型的挖掘,这就造成了用户隐私的泄露,因此防止用户隐私泄露是推荐系统中亟待解决的问题,也成为研究的一大热点。
目前推荐系统的隐私保护方法一般被分为:数据扰动,数据加密,和数据泛化三大类;虽然扰动方法较为简便但它存在着保护能力不强的问题;数据加密技术尤以同态加密技术为多,在安全方面多方计算,使得在协同过滤中使用,但其同样存在着加密算法复杂公钥生成后尺寸很大,并且没有对隐私进行严格定义的问题,数据泛化算法并没有对攻击者掌握的背景知识进行定义,当遇到新型攻击时需要不断完善;相较于这些传统的隐私保护方法存在的无法严格证明其隐私保护水平和与攻击者掌握的背景知识相关的安全性两个主要缺陷,提出了严格的可证明的ε-差分隐私保护模型,他的严格可证是建立在严格的定义和坚实的数学基础上的,该模型通过假设攻击者可以掌握最大背景知识,例如攻击者已获得除目标记录以外的所有记录,因此无需在考虑攻击者对背景知识的掌握程度,并且对隐私保护进行了量化评估,通过预算参数可以进行比较。
目前差分隐私应用在推荐算法中的研究和成果较少,最早将其应用到传统协方差矩阵中对其进行评分预测,后来又将其运用到矩阵分解中,这些都是基于评分的预测,目前在标签数据领域这方面的研究和方法基本属于空白,相比于评分泄露的用户隐私,标签泄露的问题更为突出,因此,本发明提出了基于标签的差分隐私保护的方法,旨在通过标签挖掘用户兴趣,提高推荐准确率的同时保护用户的隐私安全。
发明内容
为了解决上述问题,本发明提出了基于标签和差分隐私保护的推荐方法,通过将差分隐私保护思想融入到标签推荐系统中,并对隐私预算参数进行量化,进行带有隐私保护的基于用户兴趣的个性化安全推荐,推荐准确率高,安全性高。
为了达到本发明的目的,本发明提出了如下的具体实现方案:一种基于标签和差分隐私保护的推荐方法,包括标签相似性计算,标签进行差分隐私保护的模糊C均值聚类的过程,计算用户兴趣向量和用户相似度产生topN推荐单元,具体如下:
产生标签关联矩阵,计算标签相似性单元:利用资源标签矩阵计算标签共现矩阵,通过标签共现矩阵得到标签紧密度关联矩阵,通过关联矩阵计算标签相似性。
标签聚类差分隐私保护单元:用标签的相似性代替模糊C均值聚类的欧式距离,在聚类过程中加入符合Laplace分布的噪声,保护聚类中心点,产生具有差分隐私保护的聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910062956.7/2.html,转载请声明来源钻瓜专利网。