[发明专利]基于相似性传递的协同过滤方法及系统有效

专利信息
申请号: 201310221379.4 申请日: 2013-06-05
公开(公告)号: CN103309967B 公开(公告)日: 2016-10-26
发明(设计)人: 谢峰;陈震;许宏峰;曹军威 申请(专利权)人: 清华大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 王莹
地址: 100084 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 相似性 传递 协同 过滤 方法 系统
【说明书】:

技术领域

发明涉及网络推荐技术领域,特别涉及基于相似性传递的协同过滤方法。

背景技术

信息技术和互联网的发展将人们从信息匮乏的时代带入了信息过载的时代。在这个时代,信息的消费者难以从大量信息中找到自己真正感兴趣的内容,而信息的生产者同样很难让自己生产的信息脱颖而出匹配到合适的用户。作为21世纪非常有潜力的信息过滤技术之一,推荐系统能够较好的解决这一矛盾。它通过分析用户的历史行为,建立用户的兴趣模型,最终将用户和信息联系起来,一方面帮助用户发现对自身有价值的信息,另一方面让信息展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢。

目前,推荐系统已被广泛应用到众多领域并取得成功,如Amazon的图书推荐系统、Pandora的音乐推荐系统、Facebook的好友推荐系统、Netflix的电影推荐系统等等。协同过滤系统是最早被提出并且得到广泛应用的推荐系统,其易部署和可解释等优点受到了学术界和工业界的青睐。协同过滤,顾名思义,就是用户间可以相互协作,通过与系统的交互,从大量的信息中过滤出自己真正感兴趣的内容。根据协同过滤的定义,协同过滤算法的核心思想是用户会对与自己兴趣爱好相似的用户喜欢过的物品感兴趣,因此协同过滤算法需要计算用户间的兴趣相似度,为每个用户生成兴趣爱好相似的邻居,从而把邻居用户喜欢的物品推荐给目标用户。在用户和物品数目的不断增加,系统规模越来越庞大的情况下,用户历史行为数据的极端稀疏导致主流的相似性度量方法如余弦夹角、皮尔逊相关系数等无法精确度量用户间兴趣相似度,从而得不到期望的推荐结果。

发明内容

(一)要解决的技术问题

本发明的目的在于提供一种基于相似性传递的协同过滤方法,用于解决传统相似性准确度和辨识度不高,推荐成功率不理想的问题。

(二)技术方案

本发明技术方案包含以下步骤:

应用数据关系向量模块,遍历所有用户的历史行为数据,获得描述所有用户对物品过往喜好的关系向量;

应用阈值判定模块,使用得到的关系向量,并设定阈值,根据阈值临界原则计算各个用户间的相似性并得到大小为用户数×用户数的初始相似性矩阵;

应用相似性传递计算模块,根据初始相似性矩阵中不为零的相似性值,利用相似性传递计算方法计算前述矩阵中相似性值为零的目标用户与其他用户间相似性,最终得到更密集的相似性矩阵;

应用喜好程度估值模块,根据与目标用户相似程度最高的其他用户对目标用户未选择物品的喜好程度得到当前用户对未选择物品的喜好程度的估计值;

应用预测筛选模块,对每个用户的预测结果进行筛选,产生对每个用户的推荐物品。

优选的,所有用户对物品过往喜好的关系向量为用户对物品的购买、浏览、点击、下载、预定、收藏数据的关系向量。

优选的,根据阈值临界原则计算各个用户间的相似性的方法为:用户与用户之间共同喜欢的物品数目小于该阈值,不直接计算他们之间的相似性;用户与用户之间共同喜欢的物品数目大于或等于该阈值,直接利用用户喜好向量间夹角余弦计算他们之间的相似性。

优选的,阈值为6。

优选的,相似性传递的计算方法为:两用户之间共同喜欢的物品数目小于设定阈值,但这两用户同时与其他一些用户之间共同喜欢的物品数目大于或等于设定阈值,那么这两用户是可以直接和其他一些用户-桥梁用户计算相似性。

优选的,估计值的估值方法为,对目标用户未选择的物品,在已建立的相似性矩阵中选取与目标用户相似度大的用户群,在该用户群中挑选出选择过的物品组成该用户群的集合,将该用户群与目标用户间的相似程度作为目标用户对该物品的喜好程度的估计值的方法。

优选的,目标用户相似度大的用户群中的用户个数对预测精度和响应速度有影响。

优选的,对预测精度和响应速度影响为:选取的用户个数多,计算慢但准确度高;选取的用户个数少,计算快但准确性低。

(三)有益效果

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310221379.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top