[发明专利]基于内容与协同过滤相结合的个性化推荐方法有效
申请号: | 201810117468.7 | 申请日: | 2018-02-06 |
公开(公告)号: | CN108304556B | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 杨楠;曹三省 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京孚睿湾知识产权代理事务所(普通合伙) 11474 | 代理人: | 韩燕 |
地址: | 100024 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种基于内容与协同过滤相结合的个性化推荐方法,步骤如下:根据已发布的新闻数据获得新闻特征训练向量集;使用无监督深度学习自编码器进行训练,训练完成后得到统一特征提取器;生成用户特征训练向量集;用户特征训练向量集输入到统一特征提取器生成用户偏好模型;通过相似度比较生成用户近邻表;用户登录时系统获取待推荐的新闻列表;生成待推荐新闻特征训练向量;将待推荐新闻特征训练向量作为统一特征提取器的输入,生成待推荐新闻的基于内容的统一特征表示;将新闻的基于内容的统一特征表示与用户偏好模型进行相似度比较得到基于内容的推荐列表;根据用户近邻表得到协同过滤推荐列表;加权后生成混合推荐的Top‑N推荐列表。 | ||
搜索关键词: | 特征提取器 特征训练 协同过滤 向量集 用户偏好模型 个性化推荐 相似度比较 特征表示 用户近邻 用户特征 统一 向量 用户登录时 系统获取 新闻数据 编码器 无监督 加权 申请 发布 学习 | ||
【主权项】:
1.一种基于内容与协同过滤相结合的个性化推荐方法,其特征在于步骤如下:S1:从新闻服务器中获取已发布过的新闻数据,处理后获得新闻特征训练数据集;S2:将新闻特征训练数据集通过向量空间模型的TF‑IDF方法进行向量化,获得新闻特征训练向量集;S3:搭建一种无监督学习人工神经网络;S4:将新闻特征训练向量集作为无监督学习人工神经网络的输入,采用随机梯度下降方法训练出无监督学习神经网络的参数集,训练完成后用一个二值化层替换输出层,从而得到统一特征提取器;S5:从新闻服务器的日志文件中获取用户对新闻的阅读记录,将新闻特征训练向量集按每个用户ID进行分类,生成基于新闻特征的用户特征训练向量集;S6:将按用户ID分类的用户特征训练向量集输入到统一特征提取器;S7:统一特征提取器生成各个用户的用户偏好模型;S8:使用各个用户的用户偏好模型,通过相似度比较生成一个统一的用户近邻表;S9:系统在用户登录时获取近期一个预定时段内待推荐的新闻列表;S10:将每条待推荐新闻数据预处理,再通过向量空间模型的TF‑IDF方法进行向量化,获得每条待推荐新闻的新闻特征训练向量;S11:将待推荐新闻的特征训练向量作为统一特征提取器的输入,生成待推荐新闻的基于内容的统一特征表示;S12:将待推荐新闻的基于内容的统一特征表示与所述用户的用户偏好模型进行相似度比较,用相似度排名靠前的新闻生成基于内容的推荐列表;S13:根据所述用户的用户近邻表来对待推荐新闻进行分类、排列,用与所述用户最接近用户阅读过的新闻生成协同过滤推荐列表;S14:通过对所述基于内容的推荐列表和所述协同过滤推荐列表进行混合,生成混合推荐的Top‑N推荐列表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810117468.7/,转载请声明来源钻瓜专利网。
- 上一篇:分布式地图数据处理方法
- 下一篇:一种多人协作数据挖掘方法