[发明专利]基于深度神经网络的冷启动跨域混合推荐的方法及系统在审
申请号: | 202011605125.9 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112699310A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 王亚平;王志刚;杨硕;刘振宇;刘雅婷;王芳 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q30/06;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 贾银秋 |
地址: | 100195 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 神经网络 冷启动 混合 推荐 方法 系统 | ||
本发明公开了一种基于深度神经网络的冷启动跨域混合推荐的方法及系统,属于网络应用技术领域。本发明方法,包括:将交叉用户数据作为训练数据;针对文本向量生成集合;构建自编码器对集合中的文本向量进行训练,输出用户评分特征集合;并对集合中的用户评分特征串联,作为DNN网络的输入,用户目标域的预测评分数据作为输出,构建跨域推荐模型;获取预设量的用户足迹数据,使用预设量的用户足迹数据作为推荐数据,将推荐数据输入跨域推荐模型运算,输出对用户的推荐物品。本发明通过学习源领域到目标领域的相关性非线性映射,为目标领域提供推荐依据。
技术领域
本发明涉及网络应用技术领域,并且更具体地,涉及一种基于深度神经网络的冷启动跨域混合推荐的方法及系统。
背景技术
随着互联网的飞速发展,数据也呈指数增长,面对海量的数据,用户很难从众多选择中挑出自己感兴趣的。为了改善用户的体验,推荐系统被广泛应用于不同的场景,如在线购物、音乐推荐、电影推荐等。
推荐算法是推荐系统的核心部分,目前主要有三种方法,分别是协同过滤(Collaborative filtering(CF)-based),基于内容的推荐(content-based)和混合推荐方法。其中CF-based的推荐方法使用用户和物品的交互数据,如用户评分。content-based的方法则是依据物品或内容的元数据,发现物品和内容的相关性,然后基于用户以往的喜好记录推荐给用户相似的物品。目前CF-based的方法被广泛应用,由于它可以捕捉用户对物品最直观的评价,并且可以很容易的扩展到多个场景中,而content-based方法需要在不同领域花费一定精力去构建合适的特征集合,应用于推荐中。然而CF-based的方法目前有两个问题:
1)数据稀疏,即用户评分矩阵里包含大量空值;
2)冷启动,对于新用户缺乏足够的历史评价数据。为了解决这两个问题,混合推荐的方法被提出,其基本思想是结合用户交互级别的相似度和物品内容级别的相似度,因此学者提出在用户评分数据的基础上,增加了许多的额外信息来做辅助推荐,如物品的基本属性,用户的社交网络以及用户对物品的评论数据等。
然而在现实世界中,用户在使用新产品时,一般不愿意泄露过多的个人信息,如社交信息,而且在新产品刚刚使用时,用户的评论数据量也较少。在没有收集到足够的用户足迹数据时,有学者提出跨领域推荐(cross-domain)的思路,得到了广泛的关注,它的基本思想是给定两个相关的领域,如电影和书籍,用户在源领域有足够的历史足迹数据,而在目标领域用户历史数据较少,那么对于目标领域,这些用户可称为冷启动用户,因为两个领域的知识是相关的,可以依据用户在源领域的反馈,为目标领域提供有意义的推荐。
发明内容
针对上述问题,本发明提出了一种基于深度神经网络的冷启动跨域混合推荐的方法,包括:
获取源领域和目标域的数据,并针对源领域和目标域的数据进行筛选,获取源领域和目标域的数据的交叉用户数据,将交叉用户数据作为训练数据;
获取训练数据中交叉用户的基本信息及评论数据,对基本信息及评论数据进行文本向量的转换,生成文本向量,并针对文本向量生成集合;
构建自编码器对集合中的文本向量进行训练,输出用户评分特征集合;
并对集合中的用户评分特征串联,作为DNN网络的输入,用户目标域的预测评分数据作为输出,构建跨域推荐模型;
获取预设量的用户足迹数据,使用预设量的用户足迹数据作为推荐数据,将推荐数据输入跨域推荐模型运算,输出对用户的推荐物品。
可选的,交叉用户数据以预设的比例进行分配,一部分作为训练数据,一部分作为测试数据;
测试数据用于测试跨域推荐模型的准确度。
可选的,方法还包括:构建初始模型,并针对初始模型分层,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011605125.9/2.html,转载请声明来源钻瓜专利网。