[发明专利]一种带有差分隐私的生成式对抗网络推荐方法有效
申请号: | 202110086346.8 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112883070B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 董晓梅;王蕊;邹欣开 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06F21/62;G06N3/04;G06N3/08 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 梁焱 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 带有 隐私 生成 对抗 网络 推荐 方法 | ||
本发明提供一种带有差分隐私的生成式对抗网络推荐方法,涉及个性化推荐技术领域。该方法包括数据预处理;定义(ε,x,λ)~差分隐私进行差分隐私加噪,并引入高斯噪声机制,对数据集中数据进行保护;相关矩阵分解推荐模型CMF,将用户矩阵U和评分矩阵V映射到一个新的语义空间;除了在评级矩阵上实现最佳拟合之外,矩阵U或V中的一个分量也与另一个矩阵V或U中的每个分量紧密相关,采用相关矩阵分解获取推荐列表;搭建训练生成式对抗网络模型GAN,用于推荐列表的生成;将CMF和GAN的推荐列表进行合并,合并规则为保留重复的推荐项目。本发明在满足用户隐私数据的条件下保证足够高的推荐准确度,实现对推荐算法的隐私保护以及提升推荐准确率。
技术领域
本发明涉及个性化推荐技术领域,尤其涉及一种带有差分隐私的生成式对抗网络推荐方法。
背景技术
随着大数据时代的到来,信息冗余和信息过载的问题逐渐浮现,而推荐算法最大化地解决信息过载问题,并为企业或社会带来利润可观的商业收益。目前,推荐算法在大多数领域都显现出不容小觑的高价值,例如电子商务、电影和视频推荐、音乐电台、个性化阅读、基于位置的服务和社交网络等。研究证明,强大而精准的推荐大力地提升用户满意度和项目供应方的收益,推荐算法帮助用户快速选择以及提高相应系统的商业价值。然而,蓬勃发展的推荐技术使数据安全和隐私面临更加严峻的挑战,因为推荐技术的更精准模型往往需要庞大数量的用户数据为支撑。
推荐系统中,用户隐私数据泄露事件频繁出现,给企业和用户造成严重的损失和伤害。随着攻击方反扒信息手段的不断更新和迭代,推荐系统的数据安全性能受到重大威胁。因此面对隐私数据泄露手段的不断更新,为了保障数据安全性能的可靠性以及稳定性,通常会采用隐私数据保护的技术。但是传统的隐私保护技术使得数据可分析性下降以及推荐算法的推荐准确率降低,尤其是对数据进行加密或者直接对数据进行添加噪声等方法。对推荐算法引入隐私保护技术,不仅面临着推荐准确率下降的问题,其次也存在如何巧妙地对数据加噪而使得数据安全的问题。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种带有差分隐私的生成式对抗网络推荐方法,实现对推荐算法的隐私保护以及提升推荐准确率。
为解决上述技术问题,本发明所采取的技术方案是:
一种带有差分隐私的生成式对抗网络推荐方法,包括以下步骤:
步骤1:对电影数据集进行预处理,引入矢量对抗方案来进行类别型和文本型数据的处理;
步骤1.1:对数据集中的各字段进行归纳和分类,去掉无用的字段;
步骤1.2:对类别型字段和文本型字段预处理;
对于类别型字段的处理方式为:首先将类别型字段中的类别转成字符串到数字的字典,然后再将每个项目对应的类别型字段转成数字列表;
对于文本型字段的处理方式为:首先创建文本到数字的字典,然后将Title字段中的描述转成数字的列表;Title字段中的时间点也需要去掉;
文本型字段和类别型字段需要将长度统一,空白部分用‘PAD’对应的数字填充;
步骤1.3:电影数据集中的其它字段采用先验知识去进行归纳缩减,最后将预处理后的数据集合并为一张表;
步骤2:对经过预处理后的数据进行差分隐私加噪以及引入时刻计数法变量追踪加噪结果;
定义(ε,x,λ)~差分隐私:随机算法A满足(ε,x,λ)~差分隐私,对于所有输入数据集O1和O2最多有一个用户的一个属性值有所不同,对于所有可能的输出最终得出:
Pr[A(O1)∈O]≤exp(ε)·Pr[A(O2)∈O]+x-λ (1)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110086346.8/2.html,转载请声明来源钻瓜专利网。