[发明专利]一种基于用户的k-最近邻算法的图书推荐方法有效
申请号: | 201810049034.8 | 申请日: | 2018-01-18 |
公开(公告)号: | CN108710620B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 郝宁宁;李媛鸣;王川;陈梦瑶;石冰洁;刘二宝;祝晓雪;高婧 | 申请(专利权)人: | 日照格朗电子商务有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 济南文衡创服知识产权代理事务所(普通合伙) 37323 | 代理人: | 刘真 |
地址: | 276800 山东省日照市山海*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 近邻 算法 图书 推荐 方法 | ||
1.一种基于用户的k-最近邻算法的图书推荐方法,其特征在于,包括以下步骤:
步骤1,将用户历史图书评分行为数据按照均匀分布随机分为M份,选取一份作为测试集,将剩下的M-1份作为训练集,在用户历史图书评分行为数据的训练集上建立基于用户的k-最近邻推荐模型;
步骤2,通过k-最近邻推荐模型在用户历史图书评分行为数据的训练集上建立用户兴趣模型,生成推荐图书列表,再通过结合用户历史图书评分行为数据的测试集,计算最相似用户的个数k在初始值的情况下,k-最近邻算法的准确率和召回率;
步骤3,依次更新建立k-最近邻推荐模型中所设定算法的最相似用户的个数k值,计算不同k值下的图书推荐列表;并计算不同k值情况下,基于用户的k-最近邻算法的准确率和召回率;
步骤4,将每个不同k值所对应的准确率和召回率相加,得到基于用户的k-最近邻算法的性能指标值;取基于用户的k-最近邻算法的性能指标值的最大值所对应的参数k的值作为某用户在基于用户的k-最近邻算法的中的最优算法参数k的值;
步骤5,输入某用户在基于用户的k-最近邻算法的最优算法性能指标值,利用步骤(1)中的k-最近邻推荐模型为用户产生基于用户的k-最近邻算法的图书推荐列表。
2.根据权利要求1所述的一种基于用户的k-最近邻算法的图书推荐方法,其特征在于,步骤1中的k-最近邻推荐模型的建立步骤如下:
步骤1.1,将用户历史图书评分行为数据的训练集处理为m*n的用户图书评分矩阵R;
步骤1.2,使用皮尔逊相关系数计算用户间的相似度;
步骤1.3,对于每个用户,按从大到小的顺序将该用户与其他用户的相似度进行排序;
步骤1.4,根据相似度计算结果,结合算法参数k,生成候选推荐图书列表,再利用预测评分的计算公式,计算出候选推荐图书列表中的每本图书的预测评分,并按预测评分从大到小的顺序对候选推荐图书列表进行排序,取候选推荐图书排序列表的前几本图书组成最终的图书推荐列表,产生基于用户的k-最近邻算法的推荐图书列表。
3.根据权利要求2所述的一种基于用户的k-最近邻算法的图书推荐方法,其特征在于,步骤1.2中用户间的相似度计算公式如下:
在上述公式中,P(u,v)表示用户u和用户v之间的相似度,Iu和Iv分别表示用户u和用户v评分过的图书集合,rui和rvi分别表示用户u对物品i的评分和用户v对图书i的评分,和分别表示用户u和用户v对图书的平均评分。
4.根据权利要求2所述的一种基于用户k-最近邻算法的图书推荐方法,其特征在于,步骤1.4中预测评分的计算公式如下所示:
在上式中,和是用户u和用户u′对物品的平均评分,sim(u,u′)是用户u和用户u′之间的相似度,ru′,i表示用户u′对物品i的评分,N是与用户u最相似的邻居组成的集合。
5.根据权利要求1所述的一种基于用户k-最近邻算法的图书推荐方法,其特征在于,步骤2中的k-最近邻算法的准确率和召回率,计算公式如下所示:
a)准确率
式中,Precision(U(u)表示对于用户u,基于用户的k-最近邻算法的准确率,R(U(u))表示基于用户的k-最近邻推荐算法为用户u产生的的图书推荐列表,T(u)表示用户u评分过的物品的推荐列表,U表示所有用户;
b)召回率
式中,Recall(U(u)表示对于用户u,基于用户的k-最近邻算法的召回率,R(U(u))表示基于用户的k-最近邻推荐算法为用户u产生的的图书推荐列表,T(u)表示用户u评分过的物品的推荐列表,U表示所有用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日照格朗电子商务有限公司,未经日照格朗电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810049034.8/1.html,转载请声明来源钻瓜专利网。