[发明专利]一种基于数据非随机缺失机制的推荐系统方法有效
申请号: | 201810070082.5 | 申请日: | 2018-01-24 |
公开(公告)号: | CN108287902B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 林琛;黄洁;刘杜钢 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/02;G06Q30/06;G06Q50/00 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 随机 缺失 机制 推荐 系统 方法 | ||
1.一种基于数据非随机缺失机制的推荐系统方法,其特征在于包括以下步骤:
1)获取用户历史行为记录;
2)对得到的用户历史行为数据进行预处理;
3)对预处理后的数据划分为训练集和测试集,进行模型训练,其中数据的划分包括:当所得的评分数据中不含有时间戳时,随机将80%评分数据作为训练集,剩下的部分作为测试集;当得到的评分数据包含有时间戳时,将时间较早的80%评分数据作为训练集,剩下的部分作为测试集;采用数据非随机缺失推荐模型,模型观测变量(Rij,Xij)的生成过程如下:
3.1对每个用户i:
a)首先依概率αc,选择用户i属于的社区c;
b)从K元正态N(0,∑c)中采样一个K维向量作为社区c的中心特征向量Uc;
c)从K元正态N(Uc,∑u)中采样一个K维向量作为用户i的特征向量Uic;
d)从一元正态中采样一个值作为用户i的偏置BUi;
3.2对每个商品j:
c)从K元正态N(0,∑v)中采样一个K维向量作为商品j的特征向量Vj;
d)从一元正态中采样一个值作为商品j的偏置BVj;
3.3从正态分布中采样得到用户i对商品j的评分Rij,其中,该正态分布的均值为方差为
3.4由于用户i属于第c个社区的数据是未知的,c=1,2,...,C,以隐变量γic表示,其定义如下:
则此时商品j的社区意见表示为:其中ORj=RjXj,那么从伯努利分布中采样得到用户i对商品j的评分行为Xij,Xij即表示用户i是否愿意对商品j做出评分;
为表示方便,用θ表示所有参数,用Δ=[Uic,Vj,BUi,BVj],那么完全数据的似然函数为:
其中Δ与γi为用户和商品相关参数;
所述用于数据非随机缺失机制的推荐模型的参数学习通过求解目标函数得到,由于模型含有隐变量,所以采用期望最大化EM算法进行求解,在期望最大化算法中包括E步骤和M步骤,在E步骤中计算隐变量γic的估计,在M步骤中对参数θ进行估计;
具体的,在E步骤中:为表示方便,记中间变量ωijc为:
首先对γic进行更新操作,更新公式如下:
在M步骤中,通过利用E步骤更新得到的代入到对数似然函数,最大化该似然函数,并采用梯度上升法对各个参数进行一步优化,参数更新公式如下:
E步骤和M步骤不断迭代,直至模型收敛;
4)在模型训练结果中获取用户和商品相关参数,通过步骤3)中的期望最大化算法的迭代,达到收敛后,得到最优的参数值,包括用户社区特征向量Uic,用户的偏置值BUi,用户的社区参数γi,商品特征向量Vj,以及商品的偏置值BVj;
5)根据用户和商品相关参数预测用户对于未评分商品的偏好,并进行推荐。
2.如权利要求1所述一种基于数据非随机缺失机制的推荐系统方法,其特征在于在步骤1)中,所述获取用户历史行为记录,包括用户对商品的历史评分数据以及评分的时间戳数据。
3.如权利要求1所述一种基于数据非随机缺失机制的推荐系统方法,其特征在于在步骤2)中,所述对得到的用户历史行为数据进行预处理的具体步骤为:
(1)过滤掉数据不全的评分数据;
(2)去掉用户评分次数和商品被评分次数低于阈值的用户ID和商品ID;
(3)对评分进行数值转换。
4.如权利要求1所述一种基于数据非随机缺失机制的推荐系统方法,其特征在于在步骤5)中,所述根据用户和商品相关参数预测用户对于未评分商品的偏好,并进行推荐的具体步骤为:
(1)根据γi确定用户所属的社区c;
(2)根据公式预测用户i对商品j的评分;
(3)将得到的评分与测试集评分进行对比,衡量模型的可靠性;
(4)对评分进行降序排序,选择位于前列的多个商品,得到用户的推荐列表,对用户给出推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810070082.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成信息的方法和装置
- 下一篇:一种与投影相结合的搜题方法及智能笔
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置