[发明专利]基于大规模评分数据对用户进行商品在线实时推荐的方法在审
申请号: | 201710292884.6 | 申请日: | 2017-04-28 |
公开(公告)号: | CN108154380A | 公开(公告)日: | 2018-06-12 |
发明(设计)人: | 王成;文诗琪;张忆文;赖雄鸣;何霆;洪欣;郑国旗 | 申请(专利权)人: | 华侨大学;亚尔迪(厦门)科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;杨锴 |
地址: | 362000*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评分数据 时空效率 协同过滤 贝叶斯 离散化 成功率 并行 并行读取 独立属性 分类模型 回归模型 商品推荐 数据存储 实时性 预测 准确率 取整 算法 概率 期望 应用 | ||
1.一种基于大规模评分数据对用户进行商品在线实时推荐的方法,其特征在于,获取用户对商品的评分数据,并对其进行离散化处理作为类别属性,利用基于并行朴素贝叶斯分类模型计算用户对商品各评分类别的概率,通过期望求和预测用户对商品的评分,获得并行朴素贝叶斯回归模型;通过并行朴素贝叶斯回归模型进行协同过滤推荐,实现商品在线实时推荐。
2.根据权利要求1所述的基于大规模评分数据对用户进行商品在线实时推荐的方法,其特征在于,获取用户对商品的评分数据后,将评分数据存储于Hadoop的HDFS分布式文件系统上;其中,用户对商品的评分数据包括:用户a,商品b,用户a对商品b的评分ra,b。
3.根据权利要求2所述的基于大规模评分数据对用户进行商品在线实时推荐的方法,其特征在于,将获取的用户对商品的评分离散化处理后,作为朴素贝叶斯的分类类别Ri,i∈[1,…,s],表示有s种不同的评分。
4.根据权利要求3所述的基于大规模评分数据对用户进行商品在线实时推荐的方法,其特征在于,如果获取的评分数据为整数,则评分数据直接作为分类类别;如果获取的评分数据为小数,则采用四舍五入的方式取整后,再作为分类类别;
则,
5.根据权利要求4所述的基于大规模评分数据对用户进行商品在线实时推荐的方法,其特征在于,确定评分数据为朴素贝叶斯分类的特征属性。
6.根据权利要求5所述的基于大规模评分数据对用户进行商品在线实时推荐的方法,其特征在于,将获取的评分数据及取整的评分数据读取作为训练样本,用户和商品作为特征属性,生成用户-商品评分矩阵R={r1,1,…,ra,b,…,rm,n};其中,矩阵包括m个用户U={u1,u2,…,ua,…,um}和n个商品I={i1,i2,…,ib,…,in}。
7.根据权利要求6所述的基于大规模评分数据对用户进行商品在线实时推荐的方法,其特征在于,计算用户对商品各评分类别的概率的方法如下:
读取存储在HDFS分布式文件系统上的评分数据作为输入,则输入为<offset,(UserID,ItemID,Rating)>;其中,offset是文件位置偏移量,(UserID,ItemID,Rating)是读取数据中每一行的内容,UserID表示用户,ItemID表示商品,Rating表示用户对商品的评分;
Map-I阶段:评分Rating为key,(UserID,ItemID)和(NUM)为value,输出<Rating,(UserID,ItemID)>和<Rating,(NUM)>的键值对;其中,NUM表示训练样本中数据的总量;
Reduce-I阶段:读取Map-I阶段的输出,得到各个评分类别的概率,将评分Rating设置为key,统计各评分出现的次数NUM_Ri,结合Map-I阶段中得到的训练样本数据总量NUM,则得到各个评分类别的概率并输出<UserID Rating,(1)>、<ItemIDRating,(1)>、<Rating NUM_Ri P(Ri),(1)>的键值对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学;亚尔迪(厦门)科技有限公司,未经华侨大学;亚尔迪(厦门)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710292884.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:媒体信息的发布方法和装置
- 下一篇:提案候选提示装置以及提案候选提示方法