[发明专利]一种协同过滤推荐算法中改进的相似性度量方法无效
申请号: | 201310505323.1 | 申请日: | 2013-10-23 |
公开(公告)号: | CN103500228A | 公开(公告)日: | 2014-01-08 |
发明(设计)人: | 赵朋朋;吴健;冒九妹;鲜学丰;崔志明 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 协同 过滤 推荐 算法 改进 相似性 度量 方法 | ||
技术领域
本发明涉及推荐系统研究中协同过滤(Collaborative filtering)推荐技术,尤其涉及一种协同过滤推荐算法中改进的相似性度量方法。
背景技术
随着互联网的迅速普及和电子商务的快速发展,互联网上的信息数据急剧增长,如何使用户快速高效地从浩瀚的数据海洋中获取所需信息变得越来越紧迫。因此为用户提供主动推荐服务也越来越多地被应用到各种门户网站和电子商务系统中。这些系统通过收集用户的历史信息,学习用户的兴趣和行为模式,并分析用户的行为特征,从而为其提供推荐服务。
协同过滤推荐技术在推荐系统领域应用非常广泛,主要分为两类:基于用户的协同过滤(User-based Collaborative Filtering)和基于项目的协同过滤(Item-based Collaborative Filtering),基本思想是基于最近邻向目标用户产生推荐,最终推荐形式有评分预测及Top-N推荐。Tapestry是最早被提出来的协同过滤推荐系统,记录了每个用户阅读文章的观点,目标用户需要明确地指出与自己行为类似的其他用户。GroupLens、Ringo以及Video Recommender也是较早期的协同过滤推荐系统,通过其他用户的意见来给用户分别提供电影、新闻和音乐等推荐服务。
随着电子商务系统规模的不断扩大,用户数目和项目数据的急剧增加,导致用户项目的评分数据极端稀疏。在用户评分数据极端稀疏的情况下,传统的相似性度量方法依赖于共同评分的项目个数,使得传统的相似性度量存在着一定的偶然性,计算得到的目标用户及项目的最近邻不准确,从而导致推荐系统的推荐质量下降。
协同过滤推荐算法中主要通过相似性来预测用户对项目的评分,相似性可分别依据用户或项目之间关系进行度量,且相似性度量的精确性直接关系到整个推荐系统的推荐质量。
相似性计算可以是基于用户之间的相似性计算,也可以是基于项目之间的相似性计算。以sim(Ua,Ub)表示用户Ua和用户Ub之间的相似性,则首先获取用户Ua和用户Ub已评分的所有项目,然后通过不同的相似性度量方法计算用户Ua和用户Ub之间的相似性sim(Ua,Ub)。同理,将项目Ii和项目Ij之间的相似性记为sim(Ii,Ij),则获取项目Ii和项目Ij已有的所有用户评分,并根据已有评分值获取项目Ii和项目Ij之间的相似性sim(Ii,Ij)。
常见的相似性度量标准包括:余弦相似性、相关相似性以及修正的余弦相似性。在余弦相似性度量方法中,构建用户项目评分矩阵R(n×m)。如果用户对项目没有评分,则假设该用户对项目的评分为0。通过将用户对项目的未知评分设为0,可以有效地提高相似性计算的性能,但是当用户及项目数量非常巨大、用户对项目的评分数据极端稀疏的情况下,将未知评分设置为0的可信度并不高。
实际上,用户对未评分项目的喜好程度不可能完全相同或完全不同。当用户Ua和用户Ub对项目均未有评分时,将用户对项目的评分都设为0,无疑在计算用户Ua和用户Ub之间的相似度时提高了其相似度值,因为他们对项目的评分并不一定会完全相同为0。因此,当用户评分数据极端稀疏时,将未知评分设为0对计算相似度值影响性较高。当用户Ua和用户Ub中有一个用户对项目给出评分,而另一个用户未给出评分时,未知的评分被设为0将会使相似度的计算值小于其实际值,但当用户评分数据极端稀疏时,该影响将会较小。
由此可见,在用户评分数据极端稀疏的情况下,余弦相似性并不能有效地度量用户之间的相似性,余弦相似度的计算值实际上提高了用户间的相似度,而修正的余弦相似性度量方法也存在同样的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310505323.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种液压控制切换充填料流向用换向阀
- 下一篇:一种导电薄膜的溅镀成型装置