[发明专利]一种分布式个性化推荐方法及系统有效

专利信息
申请号: 201410225857.3 申请日: 2014-05-23
公开(公告)号: CN103995878B 公开(公告)日: 2017-10-27
发明(设计)人: 王雷;况亚萍;夏磊;张成晨 申请(专利权)人: 中国科学技术大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京凯特来知识产权代理有限公司11260 代理人: 郑立明,郑哲
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种分布式个性化推荐方法及系统,其中,该方法包括建立包含用户信息、该用户评分项目及对应评分值的评分集合;根据该集合计算所有用户的所有项目对评分差的算术平均值及同一项目对出现的总次数,并写入预先构建的项目对评分差表;其中,所述评分集合与项目对评分差表均采用Hbase表来存储;利用MapReduce映射化简模型将HDFS文件系统中存储的用户信息及其未评分项目的集合与所述项目对评分差表进行第一次联结;再将所述第一次联结结果与所述评分集合进行第二次联结,并结合预测算法计算出用户未评分项目的预测评分值;根据所述预测评分值的大小向用户进行推荐。通过采用本发明公开的方法及系统,节约了网络传输资源和输入输出开销,提高了联结效率。
搜索关键词: 一种 分布式 个性化 推荐 方法 系统
【主权项】:
一种分布式个性化推荐方法,其特征在于,该方法包括:建立包含用户信息、该用户评分项目及对应评分值的评分集合;根据该集合计算所有用户的所有项目对评分差的算术平均值及同一项目对出现的总次数,并写入预先构建的项目对评分差表;其中,所述评分集合与项目对评分差表均采用Hbase表来存储;利用MapReduce映射化简模型将HDFS文件系统中存储的用户信息及其未评分项目的集合与所述项目对评分差表进行第一次联结,并将第一次联结结果存入HDFS中;再将所述第一次联结结果与所述评分集合进行第二次联结,并结合预测算法计算出用户未评分项目的预测评分值;根据所述预测评分值的大小向用户进行推荐;其中,两次联结过程如下:将每一用户及其未评分项目作为一个子集,聚合所有用户及其未评分项目;将所有用户及其未评分项目与所述项目对评分差表进行第一次联结并将第一次联结结果存入HDFS中;具体的:联结时以子集为单位进行联结,每一子集的联结结果中包含该用户信息、该用户未评分项目、该用户未评分项目与已评分项目的项目对评分差的算术平均值及其出现的总次数;将第一次的联结结果与评分集合进行第二次联结;具体的:联结时以子集为单位进行联结,将第一次联结结果中的该用户未评分项目与已评分项目的项目对评分差的算术平均值和该用户评分集合中该项目对对应的已评分项目的评分值做减法运算,获得第二次联结结果的每一子集获得包含该用户信息、该用户未评分项目、减法运算结果及对应项目对出现总次数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410225857.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top