[发明专利]一种协同过滤算法冷启动问题的解决方法在审
申请号: | 201910287790.9 | 申请日: | 2019-04-11 |
公开(公告)号: | CN110083764A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 邵煜;谢颖华 | 申请(专利权)人: | 东华大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 协同过滤 冷启动 新用户 算法 新项目 用户信息 层次聚类算法 邻居用户 目标项目 内容信息 信息属性 传统的 凝聚式 相似度 归类 邻居 | ||
本发明的目的是:解决传统的协同过滤推荐技术中新用户和新项目的冷启动问题,完成对新用户和新项目的推荐,提高算法的推荐精度和推荐质量。为了达到上述目的,本发明的技术方案是提供了一种协同过滤算法冷启动问题的解决方法。本发明解决了传统协同过滤算法在面对新用户和新项目时的冷启动问题,结合了用户的信息属性,建立用户信息模型,计算基于用户信息的相似度,从而可以找到新用户的邻居用户。利用项目的内容信息特征,结合凝聚式层次聚类算法,得到项目的归类结果,找到目标项目的邻居项目,从而可以完成推荐。
技术领域
本发明涉及一种解决协同过滤推荐算法中冷启动问题的方法,用于大数据的个性化推荐技术领域。
背景技术
近年来,随着互联网技术的迅猛发展,一方面使得获取信息更加方便,另一方面由于海量的信息数据,带来了信息超载问题,在短暂的时间和精力内,用户难以快速地从大量信息中找到真正对自己有用的信息,降低了信息的使用率。为了有效地解决这个问题,科学家和工程师提出了两大解决方案:搜索引擎技术和信息过滤技术。由于用户需求的日益多元化和个性化,信息过滤技术更符合当下的需求。信息过滤技术通过获取用户的历史行为记录,在数据挖掘的基础上进行数据分析,自动给用户兴趣建模,把用户潜在喜欢的信息展示给用户。
个性化推荐系统是信息过滤技术的典型代表,很多不同的网站中都广泛使用了推荐系统,譬如电商购物、影视娱乐、音乐、社交媒体、广告等等。在二十世纪九十年代,“协同过滤”(Collaborative Filtering)的思想由Goldberg等人初次提出,并应用于Tapestry电子邮件过滤系统。在这之后,出现了多个基于协同过滤的系统,比如GroupLens系统可以对Usenet新闻消息自动过滤,Ringo系统用来对音乐CD和演唱家自动过滤,促进了协同过滤技术的快速发展。
协同过滤算法的基本思想是通过分析用户-项目评分数据集,计算用户之间或者项目之间基于评分的相似度,根据计算得到的相似度找到目标用户或者目标项目的邻居集,从而完成推荐。传统的协同过滤面临着数据稀疏、冷启动、可扩展等问题,影响了系统的推荐质量。本发明重点研究协同过滤的冷启动问题。冷启动问题可以分为用户冷启动和项目冷启动,当系统中有新用户加入时,由于没有该用户的历史评分记录,推荐算法无法计算其相似度,也就不能完成推荐,这就是新用户的冷启动问题。同样地,当系统中加入了新项目时,因为没有得到任何一个用户的评分,因此无法将其推荐给其他用户,这就是新项目的冷启动问题。
发明内容
本发明的目的是:解决传统的协同过滤推荐技术中新用户和新项目的冷启动问题,完成对新用户和新项目的推荐,提高算法的推荐精度和推荐质量。
为了达到上述目的,本发明的技术方案是提供了一种协同过滤算法冷启动问题的解决方法,其特征在于,包括一种融合用户信息模型的基于用户的协同过滤算法和一种采用层次聚类的基于项目的协同过滤算法,其中:
一种融合用户信息模型的基于用户的协同过滤算法包括以下步骤:
步骤101、获取数据集,数据集包括用户-项目评分数据集和用户信息属性集;
步骤102、根据历史评分数据集,判定数据集中所包含的新用户及老用户;对于新用户,随后根据用户信息属性数据集,利用Sigmoid函数计算得出针对新用户的基于用户信息模型的相似度;对于老用户,计算用户基于评分数据的相似度;
步骤103、根据步骤102所得的相似度,寻找目标用户的邻居集;
步骤104、根据步骤103得到的邻居集,计算目标用户的预测评分;
步骤105、由所得的预测评分,生成Top-N推荐列表,完成推荐;
一种采用层次聚类的基于项目的协同过滤算法包括以下步骤:
步骤201、获取数据集,数据集包括用户-项目评分数据集和项目内容信息集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910287790.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据查询方法及装置
- 下一篇:理财信息推送方法、装置、计算机设备和存储介质