[发明专利]一种基于K近邻的贝叶斯个性化推荐方法及装置在审
申请号: | 201710351281.9 | 申请日: | 2017-05-18 |
公开(公告)号: | CN107025311A | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 刘宏志;郭政;赵鹏;吴中海;张兴 | 申请(专利权)人: | 北京大学;北京华品博睿网络技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/16;G06Q30/06;G06K9/62 |
代理公司: | 北京君泊知识产权代理有限公司11496 | 代理人: | 王程远 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 近邻 贝叶斯 个性化 推荐 方法 装置 | ||
技术领域
本发明属于推荐系统领域,在贝叶斯个性化推荐方法的基础上,考虑了用户之间的相互影响,采用对级别学习排序方法,实现个性化推荐。本发明主要应用在基于隐式数据的推荐场景中,尤其在数据稀疏和数据不平衡的推荐场景中,本发明能够明显缓解数据稀疏和数据不平衡给推荐结果带来的负面影响,有效地进行个性化推荐。
背景技术
基于用户的协同过滤推荐技术:
基于用户的协同过滤推荐技术认为一个用户会喜欢和他有相似兴趣爱好的用户喜欢的商品,因此该方法最重要的步骤是计算用户之间的相似度,生成用户-用户相似度模型,依据用户的相似用户在未评分项目上的评分来进行推荐。
矩阵分解技术:
矩阵分解技术根据用户-项目评分矩阵将用户和项目表示为隐空间中的向量,用户在某维度上的数值表示用户在该维度上的感兴趣程度,项目在某维度上的数值表示项目属于该维度的程度。用户对项目的评分预测通过用户的隐向量和项目的隐向量的內积实现。
贝叶斯个性化排序技术:
贝叶斯个性化排序算法的主要思想是通过最大化后验概率以获得用户的个性化最优序列。该算法是一种对级别的学习排序算法,通过用户对项目的评分构建每个用户的项目序对关系集合,并在该集合上定义目标函数,通过对该目标函数进行学习获得模型参数。传统的贝叶斯个性化排序算法假设各个用户之间是相互的独立的,忽略了用户之间相互影响。
发明内容
推荐技术的目标是为用户进行个性化的推荐,帮助用户在大量的数据中快速获取自己感兴趣的信息。推荐技术主要依靠对用户历史行为数据的整理和分析(包括历史浏览网页、评分数据等),为用户推荐用户可能感兴趣的潜在信息,该技术不需要用户提供明确的信息数据的表述,就能缓解信息过载问题。
本发明解决其技术问题所采用的技术方案是:首先根据用户之间的相似度寻找和用户最为相近的k个邻居用户。其次根据用户的观测项目和由相似的邻居用户组成的用户群的观测项目对整个项目集合进行划分。然后采用对级别的学习排序方法,将用户对项目的偏好表示成项目对之间的偏好序,通过最大化所有用户在整体项目集合上项目对偏好排序的概率即可得到目标函数。最后采用随机梯度下降法对目标函数中的参数进行求解,由求解得到的模型进行预测产生最终的推荐结果。
本发明出发点是在贝叶斯个性化排序技术的基础上考虑用户之间的相互影响,以解决贝叶斯个性化排序技术的假设中存在的问题。具体地说,基于K近邻的贝叶斯个性化推荐技术不仅考虑了用户相互作用对未观测数据的影响,同时,通过加入惩罚因子考虑用户之间相互作用对已观测数据的影响。该技术主要包含三个子过程,分别为寻找K近邻、根据当前用户和邻居用的历史行为对项目集进行划分和采用基于对级别的学习排序方法来训练模型。
本发明的技术方案为:
1)对于每个用户,计算用户之间的相似度,选择与当前用户最为相似的k个用户构成K近邻用户群;
2)根据用户的观测项目和K近邻用户群的观测项目对整个项目集进行划分;
3)采用对级别的学习排序方法,将用户对项目的偏好表示成项目对之间的偏好序,通过最大化所有用户在整体项目集合上项目对偏好排序的概率即可得到目标函数。最后采用随机梯度下降法对目标函数中的参数进行求解。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,步骤1)中选择与用户最为相似的k个用户构成K近邻用户群,具体过程为:
在用户行为数据上,根据用户对项目的反馈行为,对于每个用户,计算该用户与其他用户的余弦相似度,相似度计算方式为:
其中Pu和Pw分别代表观测的用户u和w的正反馈项目集;按照相似度从大到小排序,选择相似度最大的k个邻居用户组成该用户的K近邻用户群。
进一步,上述步骤2)中对项目集合进行划分,具体过程为:
(1)对于当前用户,从用户-用户邻居模型中获取该用户的K近邻用户群;
(2)从观测数据中,获取该用户的已观测正反馈项目集合(Pu);
(3)从观测数据中,获取该用户未观测而其K近邻用户群(N)已观测到正反馈项目的集合(Cu),
(4)剩余的、用户和其K近邻均未观测到有正反馈的项目集合(Lu),Lu=I-Pu-Cu。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北京华品博睿网络技术有限公司,未经北京大学;北京华品博睿网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710351281.9/2.html,转载请声明来源钻瓜专利网。