[发明专利]一种结合标签和时间因素的协同过滤推荐方法在审
申请号: | 201810001758.5 | 申请日: | 2018-01-02 |
公开(公告)号: | CN108334558A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 杨明;张春霞 | 申请(专利权)人: | 南京师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/06;G06Q30/02;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 葛潇敏 |
地址: | 210023 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时间因素 协同过滤 标签 个性化推荐 邻居用户 数据稀疏 有效缓解 物品集 相似度 预测 算法 | ||
1.一种结合标签和时间因素的协同过滤推荐方法,其特征在于包括如下步骤:
步骤1,基于评分或标签计算用户间、物品间的相似度;
步骤2,寻找邻居用户集、物品集;
步骤3,预测评分,提供个性化推荐。
2.如权利要求1所述的一种结合标签和时间因素的协同过滤推荐方法,其特征在于:所述步骤1中,在计算相似度前,首先对标签信息进行预处理,将文本信息转化成数字信息。
3.如权利要求1所述的一种结合标签和时间因素的协同过滤推荐方法,其特征在于:所述步骤1中,基于标签计算相似度的公式是:
其中,用户u1或物品i1的标签集所对应的数值型标签向量为t=(t1,t2,…,tm),用户u2或物品i2的标签集所对应的数值型标签向量为s=(s1,s2,…,sm)。
4.如权利要求1所述的一种结合标签和时间因素的协同过滤推荐方法,其特征在于:所述步骤1中,基于评分计算用户间相似度的公式是:
其中,Ruj、Rvj分别表示用户u对物品j的评分和用户v对物品j的评分,分别表示用户u对所有物品的平均评分和用户v对所有物品的平均评分,Iuv表示用户u和用户v共同评论的物品集,wi为热门物品惩罚项。
5.如权利要求4所述的一种结合标签和时间因素的协同过滤推荐方法,其特征在于:所述热门物品惩罚项wi的计算公式是:
其中,Ni表示评论过物品i的用户数。
6.如权利要求1所述的一种结合标签和时间因素的协同过滤推荐方法,其特征在于:所述步骤1中,基于评分计算物品间相似度的公式是:
其中,Rui、Ruj分别表示用户u对物品i的评分和用户u对物品j的评分,分别表示物品i和物品j的平均评分,Uij表示共同评论物品i和物品j的用户集。
7.如权利要求1所述的一种结合标签和时间因素的协同过滤推荐方法,其特征在于:所述步骤2中,获得用户间或物品间的相似度矩阵后,对相似度矩阵进行排序,得到topk个与活动用户/物品最相似的邻居用户/物品集合,分别记为N(u)、N(i)。
8.如权利要求1所述的一种结合标签和时间因素的协同过滤推荐方法,其特征在于:所述步骤3中,采用如下模型进行预测:
其中,λ是平衡参数,分别表示用户u对所有物品的平均评分和用户v对所有物品的平均评分,N(u)、N(i)分别表示邻居用户集和邻居物品集,Rvi、Ruj分别表示用户v对物品i的评分和用户u对物品j的评分,分别表示物品i和物品j的平均评分,f(*)是时间权值,且f(*)=1-exp(-*);tvi表示用户v对物品i评论的时间,tuj表示用户u对物品j评论的时间;
simunify*(u,v)表示结合评分信息和标签信息计算用户间的相似度,具体模型如下所示:
simunify*(u,v)=β×simrating*(u,v)+(1-β)simtag(u,v)
simtag(u,v)是用户u和用户v的标签集之间的相似性,
simrating*(u,v)是用户u和用户v的评分之间的相似性,
β是平衡参数;
simunify*(i,j)表示结合评分信息和标签信息计算物品间的相似度,具体模型如下所示:
simunify*(i,j)=α×simrating(i,j)+(1-α)×simtag(i,j)
simtag(i,j)是物品i和物品j的标签集之间的相似性,
simrating(i,j)是物品i和物品j的评分之间的相似性,
α是平衡参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京师范大学,未经南京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810001758.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分析互联网金融海量日志的方法及系统
- 下一篇:一种图数据的处理方法及装置