[发明专利]基于同态加密的矩阵分解推荐方法有效
申请号: | 201910339962.2 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110209994B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 李先贤;李东城;王利娥;刘鹏;李春培 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;H04L9/00;G06F16/953;G06Q30/02;G06Q30/06 |
代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 陈跃琳 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 同态 加密 矩阵 分解 推荐 方法 | ||
本发明公开一种基于同态加密的矩阵分解推荐方法,采用同态加密算法,在用户计算梯度传输到服务器进行数据聚合之前,进行加密传输,在数据发送到服务器上后,由于每个用户的梯度是经过加密的,服务器无法根据梯度推断用户信息;针对在梯度下降矩阵分解的计算时需要进行多次迭代,用户端计算压力大且传输数据通信量大的问题,本发明采用小批量梯度方法与随机投影降维相结合的方法,在降低计算量和数据通信量的同时,保证了数据效用性。
技术领域
本发明涉及推荐系统技术领域,具体涉及一种基于同态加密的矩阵分解推荐方法。
背景技术
互联网的出现和普及给用户带来便利的同时存储了大量的信息,在一个信息过载,用户需求的多样性也在不断提升的时代,如何能在海量数据中,根据用户的偏向性,提取出与用户兴趣一致的信息,以满足用户个性化需求的信息,已成为一大难题,而推荐系统正是解决该问题的一个有力工具,受到了学术界与工业界众多的关注和研究。推荐系统应用于不同的领域,它推荐的对象也各不相同,面对信息的多元化、多样化,通常推荐系统需要收集与挖掘用户的历史行为数据,对用户历史行为数据进行建模分析,并以此为基础预测用户未来的行为,例如Google利用搜索历史数据提供个性化广告服务,Amazon利用购买历史提供购买推荐,Netflix根据历史观影提供视频推荐等等。
传统的推荐算法有:基于内容推荐、协同过滤推荐和混合推荐算法等。相比传统的推荐算法,基于矩阵分解的推荐算法有更低的均方根误差(RMES),更高的推荐精确度,因此受到了越来越多的关注。然而,无论是基于何种推荐算法,都必须依赖于用户的个人信息,用户需要把各自的历史数据提供给服务器,如此一来,这就存在隐私泄露的风险,随着人们对隐私保护问题的重视,更多的数据拥有者不愿意提供自身的数据。
为解决以上问题,基于同态加密的矩阵分解算法被提了出来,其主要思想是用户历史数据保存在本地,然后利用梯度下降的方法在用户端与服务器(推荐系统)之间,根据原始评分矩阵,迭代计算分解的用户特征矩阵与项目特征矩阵,填补空缺评分,最后在用户端本地进行推荐。相当于每个用户根据自己的历史数据记录对空缺项目做评分预测,然后在本地做推荐,以保证数据的安全性。不过在这样的分布式场景下做矩阵分解,在数据交互的过程中,服务器还是能够根据用户交互的梯度去推断用户的历史数据,为了防止隐私泄露,最自然的想法就是在每个用户传输梯度数据之前进行扰乱,再发送到服务器上,以保证用户隐私。相比已有的矩阵分解推荐算法,基于同态加密的矩阵分解算法存在以下优势和挑战:
在分布式场景下,用户无需将自身的数据发送给服务器,即使是做推荐时,也是在各个用户本地进行推荐,服务器既无法获取用户历史数据,也无法预测用户行为。因此在分布式应用场景下,一定程度上可以防止服务器恶意收集或推测用户数据。
但是分布式的场景下的矩阵分解推荐方法,依然存在隐私安全问题。比如常见的电影推荐,推荐系统通常要获取用户对某个电影的评分数据,以此来做分析推荐。通常在进行梯度下降矩阵分解时,每次迭代中用户与服务器都会进行交互,用户在本地计算后发送梯度给服务器时,如果直接发送原始梯度数据,服务器就有可能推断出用户对哪个电影是有评分的。有相关工作提出采用差分隐私保护模型,来保护数据安全,但与此同时也牺牲了部分的数据效用性,因为在经过每一轮的迭代梯度下降计算时,每个用户需计算各自的梯度后进行加噪再发送到服务器,所以当迭代计算完成时,矩阵分解得出的特征矩阵会存在很大的误差,也直接导致推荐效果的下降。因此在做推荐时,如何保护用户的梯度数据不能被恶意服务器推断出隐私信息同时能够保证更好的推荐效果也成为一大挑战。
此外,我们注意到,采用矩阵分解梯度下降算法进行推荐时,需要在用户端与服务器之间不断地进行迭代的计算时,也就是用户与服务器之间的交互频繁,而且采用传统的梯度下降方式会导致收敛速度过慢,传输数据量大,用户端需要频繁计算,无疑会增加用户端的计算压力,因此,如何提升减少计算量和通讯开销也成为一个亟待解决的问题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910339962.2/2.html,转载请声明来源钻瓜专利网。