[发明专利]一种协同过滤算法冷启动问题的解决方法在审
申请号: | 201910287790.9 | 申请日: | 2019-04-11 |
公开(公告)号: | CN110083764A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 邵煜;谢颖华 | 申请(专利权)人: | 东华大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的目的是:解决传统的协同过滤推荐技术中新用户和新项目的冷启动问题,完成对新用户和新项目的推荐,提高算法的推荐精度和推荐质量。为了达到上述目的,本发明的技术方案是提供了一种协同过滤算法冷启动问题的解决方法。本发明解决了传统协同过滤算法在面对新用户和新项目时的冷启动问题,结合了用户的信息属性,建立用户信息模型,计算基于用户信息的相似度,从而可以找到新用户的邻居用户。利用项目的内容信息特征,结合凝聚式层次聚类算法,得到项目的归类结果,找到目标项目的邻居项目,从而可以完成推荐。 | ||
搜索关键词: | 协同过滤 冷启动 新用户 算法 新项目 用户信息 层次聚类算法 邻居用户 目标项目 内容信息 信息属性 传统的 凝聚式 相似度 归类 邻居 | ||
【主权项】:
1.一种协同过滤算法冷启动问题的解决方法,其特征在于,包括一种融合用户信息模型的基于用户的协同过滤算法和一种采用层次聚类的基于项目的协同过滤算法,其中:一种融合用户信息模型的基于用户的协同过滤算法包括以下步骤:步骤101、获取数据集,数据集包括用户‑项目评分数据集和用户信息属性集;步骤102、根据历史评分数据集,判定数据集中所包含的新用户及老用户;对于新用户,随后根据用户信息属性数据集,利用Sigmoid函数计算得出针对新用户的基于用户信息模型的相似度;对于老用户,计算用户基于评分数据的相似度;步骤103、根据步骤102所得的相似度,寻找目标用户的邻居集;步骤104、根据步骤103得到的邻居集,计算目标用户的预测评分;步骤105、由所得的预测评分,生成Top‑N推荐列表,完成推荐;一种采用层次聚类的基于项目的协同过滤算法包括以下步骤:步骤201、获取数据集,数据集包括用户‑项目评分数据集和项目内容信息集;步骤202、根据历史评分数据集,判定数据集中所包含的新项目及老项目;对于新项目,根据项目内容信息集,计算项目内容的欧氏距离,采用凝聚式层次聚类找到目标项目的邻居集;对于老项目,计算项目基于评分数据的相似度,寻找邻居集;步骤203、根据步骤202得到的邻居集,计算目标项目的预测评分;步骤204、由所得的预测评分,生成Top‑N推荐列表,完成推荐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910287790.9/,转载请声明来源钻瓜专利网。
- 上一篇:数据查询方法及装置
- 下一篇:理财信息推送方法、装置、计算机设备和存储介质