[发明专利]基于聚类的协同过滤的商品推荐方法及系统在审
申请号: | 201310379073.1 | 申请日: | 2013-08-27 |
公开(公告)号: | CN103412948A | 公开(公告)日: | 2013-11-27 |
发明(设计)人: | 刘云;王琪;曹伟;王星;桂畅旎 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 毛燕生 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 协同 过滤 商品 推荐 方法 系统 | ||
技术领域
本发明属于数据挖掘技术领域,特别涉及一种基于聚类的协同过滤的商品推荐方法及系统。
背景技术
随着电子商务网站的快速发展,推荐系统已经被广泛研究和应用。推荐系统通过提取分析用户的资料、行为、评分等信息,获得用户的喜好,来帮助电商找到特定的用户为其推荐可能购买的产品,增加商品的销售量。
目前被广泛研究的推荐系统有的是采用基于内容的推荐算法、协同过滤推荐算法等。基于内容的推荐算法是通过用户购买过的产品的特征,为用户推荐与其相似的产品。这种算法的优点是可以处理冷启动问题,处理新加入的产品,并且这种算法不会受到打分稀疏性的问题,因为它不依赖于用户对产品的评分。但是它的缺点是无法处理像图形、视频和音乐这种难以分析提取内容特征的商品。与之相反,协同过滤算法则是利用用户-产品评分矩阵,计算用户或产品之间的相似度,利用相似度较高的邻居对其他产品进行评分预测,并根据预测评分的高低为目标用户进行推荐。但是每一个用户购买的产品数量通常不到产品总数的1%,所以造成用户-产品评分矩阵非常稀疏,从而使得推荐结果不佳。Sarwar等(Sarwar B,Karypis G,Konstan J,et al.Item-based collaborative filtering rec-ommendation algorithms.Proc10th Int’1WWW Conf,Hong Kong,2001,1-5)通过计算商品之间的相似度,预测目标用户对未购买商品的可能打分,为目标用户推荐商品。Mooney等(Mooney RJ,Bennett PN,Roy L.Book recommending using text categorization with extracted information.Proc Recommender Systems Papers from1998Workshop,Technical Report WS-98-08,1998)提出了基于文本分类的图书推荐系统。
通用的协同过滤方法由于存在稀疏性问题,导致推荐结果不准确,而普通的基于内容的推荐算法则对于视频、音乐等商品的内容特征提取困难。
发明内容
本发明的目的在于避免上述现有技术中的不足之处而提供了一种基于聚类的协同过滤的商品推荐方法及系统,本发明采取了如下技术方案:
基于聚类的协同过滤的商品推荐方法,包含以下步骤:
步骤1)利用购物网站的API接口获取用户对商品的评分信息和商品的类型标签信息;
步骤2)根据用户的购买商品类型,对用户进行聚类;
步骤3)根据聚类的结果,并通过评分估值公式为用户-商品评分矩阵中缺省评分赋予评分估值;
步骤4)计算矩阵中商品之间的相似度,对目标用户未购买商品进行预测评分,并为目标用户推荐预测评分最高的前N件商品。
所述步骤2)具体包括:
步骤2.1)用户c对商品s的评分表示为Rc,s,用户对商品类型i的评分公式为,
其中,分子表示,用户c已购买的商品中属于类型i的商品的评分的求和,分子|s|表示用户c已购买的商品中属于类型i的商品总数,1≤tc,i≤5;
步骤2.2)根据用户对商品类型的评分,构建出一个用户-类型评分矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310379073.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:烫钻自动装配机复合装置
- 下一篇:防水防鼠蚁机场助航灯光电缆