[发明专利]一种基于数据非随机缺失机制的推荐系统方法有效

专利信息
申请号: 201810070082.5 申请日: 2018-01-24
公开(公告)号: CN108287902B 公开(公告)日: 2020-11-20
发明(设计)人: 林琛;黄洁;刘杜钢 申请(专利权)人: 厦门大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06Q30/02;G06Q30/06;G06Q50/00
代理公司: 厦门南强之路专利事务所(普通合伙) 35200 代理人: 马应森
地址: 361005 *** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 随机 缺失 机制 推荐 系统 方法
【权利要求书】:

1.一种基于数据非随机缺失机制的推荐系统方法,其特征在于包括以下步骤:

1)获取用户历史行为记录;

2)对得到的用户历史行为数据进行预处理;

3)对预处理后的数据划分为训练集和测试集,进行模型训练,其中数据的划分包括:当所得的评分数据中不含有时间戳时,随机将80%评分数据作为训练集,剩下的部分作为测试集;当得到的评分数据包含有时间戳时,将时间较早的80%评分数据作为训练集,剩下的部分作为测试集;采用数据非随机缺失推荐模型,模型观测变量(Rij,Xij)的生成过程如下:

3.1对每个用户i:

a)首先依概率αc,选择用户i属于的社区c;

b)从K元正态N(0,∑c)中采样一个K维向量作为社区c的中心特征向量Uc

c)从K元正态N(Uc,∑u)中采样一个K维向量作为用户i的特征向量Uic

d)从一元正态中采样一个值作为用户i的偏置BUi

3.2对每个商品j:

c)从K元正态N(0,∑v)中采样一个K维向量作为商品j的特征向量Vj

d)从一元正态中采样一个值作为商品j的偏置BVj

3.3从正态分布中采样得到用户i对商品j的评分Rij,其中,该正态分布的均值为方差为

3.4由于用户i属于第c个社区的数据是未知的,c=1,2,...,C,以隐变量γic表示,其定义如下:

则此时商品j的社区意见表示为:其中ORj=RjXj,那么从伯努利分布中采样得到用户i对商品j的评分行为Xij,Xij即表示用户i是否愿意对商品j做出评分;

为表示方便,用θ表示所有参数,用Δ=[Uic,Vj,BUi,BVj],那么完全数据的似然函数为:

其中Δ与γi为用户和商品相关参数;

所述用于数据非随机缺失机制的推荐模型的参数学习通过求解目标函数得到,由于模型含有隐变量,所以采用期望最大化EM算法进行求解,在期望最大化算法中包括E步骤和M步骤,在E步骤中计算隐变量γic的估计,在M步骤中对参数θ进行估计;

具体的,在E步骤中:为表示方便,记中间变量ωijc为:

首先对γic进行更新操作,更新公式如下:

在M步骤中,通过利用E步骤更新得到的代入到对数似然函数,最大化该似然函数,并采用梯度上升法对各个参数进行一步优化,参数更新公式如下:

E步骤和M步骤不断迭代,直至模型收敛;

4)在模型训练结果中获取用户和商品相关参数,通过步骤3)中的期望最大化算法的迭代,达到收敛后,得到最优的参数值,包括用户社区特征向量Uic,用户的偏置值BUi,用户的社区参数γi,商品特征向量Vj,以及商品的偏置值BVj

5)根据用户和商品相关参数预测用户对于未评分商品的偏好,并进行推荐。

2.如权利要求1所述一种基于数据非随机缺失机制的推荐系统方法,其特征在于在步骤1)中,所述获取用户历史行为记录,包括用户对商品的历史评分数据以及评分的时间戳数据。

3.如权利要求1所述一种基于数据非随机缺失机制的推荐系统方法,其特征在于在步骤2)中,所述对得到的用户历史行为数据进行预处理的具体步骤为:

(1)过滤掉数据不全的评分数据;

(2)去掉用户评分次数和商品被评分次数低于阈值的用户ID和商品ID;

(3)对评分进行数值转换。

4.如权利要求1所述一种基于数据非随机缺失机制的推荐系统方法,其特征在于在步骤5)中,所述根据用户和商品相关参数预测用户对于未评分商品的偏好,并进行推荐的具体步骤为:

(1)根据γi确定用户所属的社区c;

(2)根据公式预测用户i对商品j的评分;

(3)将得到的评分与测试集评分进行对比,衡量模型的可靠性;

(4)对评分进行降序排序,选择位于前列的多个商品,得到用户的推荐列表,对用户给出推荐。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810070082.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top