[发明专利]一种协同过滤推荐方法及系统有效
申请号: | 201510710922.6 | 申请日: | 2015-10-28 |
公开(公告)号: | CN105426392B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 郑冰 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 协同 过滤 推荐 方法 系统 | ||
1.一种协同过滤推荐方法,其特征在于,包括:
获取用户群组中每一个用户分别感兴趣的项目;
确定每一个用户对其感兴趣的每一个项目的权重值;
根据所述用户群组中的每一个用户分别感兴趣的项目以及根据每一个用户对其感兴趣的每一个项目的权重值,获取推荐给每一个用户的项目列表;
根据所述用户群组中的每一个用户分别感兴趣的项目以及根据每一个用户对其感兴趣的每一个项目的权重值,获取推荐给每一个用户的项目列表,包括:
根据用户群组中每一个用户分别感兴趣的项目生成项目-用户矩阵;其中,所述项目-用户矩阵用于表征同时对任意两个项目感兴趣的用户的个数;
根据每一个用户对其感兴趣的每一个项目的权重值生成权重矩阵;所述权重矩阵中第i行第j列的项目Rij用于表征用户j对项目i赋予的权重值;
根据所述项目-用户矩阵与所述权重矩阵的乘积,确定推荐给每一个用户的项目列表。
2.根据权利要求1所述的方法,其特征在于,所述确定推荐给每一个用户的项目列表,包括:
根据所述项目-用户矩阵与所述权重矩阵的乘积,确定推荐给每一个用户的初始项目列表,其中,每一个用户的初始项目列表中包括该用户对每一个项目的总分值;
按照总分值从大到小的顺序对每一个用户的初始项目列表中的各个项目排序;
将排序后的各个项目作为最终推荐给相应用户的项目列表。
3.根据权利要求1所述的方法,其特征在于,所述确定每一个项目的权重值,包括:
确定每一个项目的发生年代;
根据发生年代,对各个项目赋权重值;其中,发生年代距离当前时间越近的项目,权重值越大;反之,发生年代距离当前时间越远的项目,权重值越小。
4.根据权利要求1-3中任一所述的方法,其特征在于,所述获取用户群组中每一个用户分别感兴趣的项目,包括:
在用户群组所对应的每一台日志服务器中,搭建Flume,并利用每一台日志服务器上搭建的该Flume采集相应日志服务器中产生的日志信息;所述日志信息包括用户标识、项目标识和项目发生年代;
将每一台日志服务器上搭建的Flume将采集的日志信息发送给中转Flume;
利用中转Flume将接收到的日志信息发送给HDFS进行存储;
利用MapReduce算法对存储在HDFS中的日志信息进行分析,以确定每一个用户分别感兴趣的项目。
5.一种协同过滤推荐系统,其特征在于,包括:
第一获取单元,用于获取用户群组中每一个用户分别感兴趣的项目;
确定单元,用于确定每一个用户对其感兴趣的每一个项目的权重值;
第二获取单元,用于根据所述用户群组中的每一个用户分别感兴趣的项目以及根据每一个用户对其感兴趣的每一个项目的权重值,获取推荐给每一个用户的项目列表;
所述第二获取单元,具体用于根据用户群组中每一个用户分别感兴趣的项目生成项目-用户矩阵;其中,所述项目-用户矩阵用于表征同时对任意两个项目感兴趣的用户的个数;根据每一个用户对其感兴趣的每一个项目的权重值生成权重矩阵;所述权重矩阵中第i行第j列的项目Rij用于表征用户j对项目i赋予的权重值;根据所述项目-用户矩阵与所述权重矩阵的乘积,确定推荐给每一个用户的项目列表。
6.根据权利要求5所述的协同过滤推荐系统,其特征在于,所述第二获取单元,具体用于根据所述项目-用户矩阵与所述权重矩阵的乘积,确定推荐给每一个用户的初始项目列表,其中,每一个用户的初始项目列表中包括该用户对每一个项目的总分值;按照总分值从大到小的顺序对每一个用户的初始项目列表中的各个项目排序;将排序后的各个项目作为最终推荐给相应用户的项目列表。
7.根据权利要求5所述的协同过滤推荐系统,其特征在于,所述确定单元,具体用于确定每一个项目的发生年代;根据发生年代,对各个项目赋权重值;其中,发生年代距离当前时间越近的项目,权重值越大;反之,发生年代距离当前时间越远的项目,权重值越小。
8.根据权利要求5-7中任一所述的协同过滤推荐系统,其特征在于,所述第一获取单元,具体用于在用户群组所对应的每一台日志服务器中,搭建Flume,并利用每一台日志服务器上搭建的该Flume采集相应日志服务器中产生的日志信息;所述日志信息包括用户标识、项目标识和项目发生年代;将每一台日志服务器上搭建的Flume将采集的日志信息发送给中转Flume;利用中转Flume将接收到的日志信息发送给HDFS进行存储;利用MapReduce算法对存储在HDFS中的日志信息进行分析,以确定每一个用户分别感兴趣的项目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510710922.6/1.html,转载请声明来源钻瓜专利网。