[发明专利]一种协同过滤推荐算法中改进的相似性度量方法无效

专利信息
申请号: 201310505323.1 申请日: 2013-10-23
公开(公告)号: CN103500228A 公开(公告)日: 2014-01-08
发明(设计)人: 赵朋朋;吴健;冒九妹;鲜学丰;崔志明 申请(专利权)人: 苏州大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 常亮
地址: 215123 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 协同 过滤 推荐 算法 改进 相似性 度量 方法
【说明书】:

技术领域

发明涉及推荐系统研究中协同过滤(Collaborative filtering)推荐技术,尤其涉及一种协同过滤推荐算法中改进的相似性度量方法。

背景技术

随着互联网的迅速普及和电子商务的快速发展,互联网上的信息数据急剧增长,如何使用户快速高效地从浩瀚的数据海洋中获取所需信息变得越来越紧迫。因此为用户提供主动推荐服务也越来越多地被应用到各种门户网站和电子商务系统中。这些系统通过收集用户的历史信息,学习用户的兴趣和行为模式,并分析用户的行为特征,从而为其提供推荐服务。

协同过滤推荐技术在推荐系统领域应用非常广泛,主要分为两类:基于用户的协同过滤(User-based Collaborative Filtering)和基于项目的协同过滤(Item-based Collaborative Filtering),基本思想是基于最近邻向目标用户产生推荐,最终推荐形式有评分预测及Top-N推荐。Tapestry是最早被提出来的协同过滤推荐系统,记录了每个用户阅读文章的观点,目标用户需要明确地指出与自己行为类似的其他用户。GroupLens、Ringo以及Video Recommender也是较早期的协同过滤推荐系统,通过其他用户的意见来给用户分别提供电影、新闻和音乐等推荐服务。

随着电子商务系统规模的不断扩大,用户数目和项目数据的急剧增加,导致用户项目的评分数据极端稀疏。在用户评分数据极端稀疏的情况下,传统的相似性度量方法依赖于共同评分的项目个数,使得传统的相似性度量存在着一定的偶然性,计算得到的目标用户及项目的最近邻不准确,从而导致推荐系统的推荐质量下降。

协同过滤推荐算法中主要通过相似性来预测用户对项目的评分,相似性可分别依据用户或项目之间关系进行度量,且相似性度量的精确性直接关系到整个推荐系统的推荐质量。

相似性计算可以是基于用户之间的相似性计算,也可以是基于项目之间的相似性计算。以sim(Ua,Ub)表示用户Ua和用户Ub之间的相似性,则首先获取用户Ua和用户Ub已评分的所有项目,然后通过不同的相似性度量方法计算用户Ua和用户Ub之间的相似性sim(Ua,Ub)。同理,将项目Ii和项目Ij之间的相似性记为sim(Ii,Ij),则获取项目Ii和项目Ij已有的所有用户评分,并根据已有评分值获取项目Ii和项目Ij之间的相似性sim(Ii,Ij)。

常见的相似性度量标准包括:余弦相似性、相关相似性以及修正的余弦相似性。在余弦相似性度量方法中,构建用户项目评分矩阵R(n×m)。如果用户对项目没有评分,则假设该用户对项目的评分为0。通过将用户对项目的未知评分设为0,可以有效地提高相似性计算的性能,但是当用户及项目数量非常巨大、用户对项目的评分数据极端稀疏的情况下,将未知评分设置为0的可信度并不高。

实际上,用户对未评分项目的喜好程度不可能完全相同或完全不同。当用户Ua和用户Ub对项目均未有评分时,将用户对项目的评分都设为0,无疑在计算用户Ua和用户Ub之间的相似度时提高了其相似度值,因为他们对项目的评分并不一定会完全相同为0。因此,当用户评分数据极端稀疏时,将未知评分设为0对计算相似度值影响性较高。当用户Ua和用户Ub中有一个用户对项目给出评分,而另一个用户未给出评分时,未知的评分被设为0将会使相似度的计算值小于其实际值,但当用户评分数据极端稀疏时,该影响将会较小。

由此可见,在用户评分数据极端稀疏的情况下,余弦相似性并不能有效地度量用户之间的相似性,余弦相似度的计算值实际上提高了用户间的相似度,而修正的余弦相似性度量方法也存在同样的问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310505323.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top