[发明专利]一种针对单类协同过滤问题的负样本选择方法有效

专利信息
申请号: 201710285697.5 申请日: 2017-04-27
公开(公告)号: CN107423335B 公开(公告)日: 2020-06-05
发明(设计)人: 刘梦娟;马小栓;薛浩 申请(专利权)人: 电子科技大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/9536;G06Q30/02
代理公司: 暂无信息 代理人: 暂无信息
地址: 611731 四川省*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 协同 过滤 问题 样本 选择 方法
【说明书】:

发明提供一种针对单类协同过滤问题的负样本选择方法,目的是为基于机器学习模型的推荐算法中,针对没有明确负样本的隐式反馈场景,帮助选择每个用户的负样本。具体步骤如下:(1)基于物品流行度计算物品被选择为负样本的权重;(2)基于用户的社交关系计算物品被选择为负样本的权重;(3)基于用户对物品特征的偏好计算物品被选择为负样本的权重;(4)融合物品的流行度权重、社交关系权重、物品特征权重,计算物品被选择为目标用户的负样本的概率;(5)根据该用户的正样本数,按照一定比例选择负样本概率最高的若干物品作为目标用户的负样本。

技术领域

本发明属于互联网推荐技术领域,特别涉及一种负样本不明确场景下的负样本选择方法。

背景技术

随着互联网数据的爆炸式增长,如何从海量数据中提取有效信息提供给用户是当前互联网 应用亟待解决的问题。个性化信息推荐是解决这一问题的有效方法,它通过跟踪用户的历史行 为,提取用户的兴趣特征,分析信息与用户特征的匹配程度,从而给用户推荐可能感兴趣的信 息。目前个性化信息推荐已经被各大互联网平台广泛采用,作为增强用户粘度,提高平台收益 的重要工具。例如,京东商城给用户推荐商品;网易云音乐给用户推荐歌曲;爱奇艺视频网站 给用户推荐视频;新闻网站为用户推荐新闻等。目前广泛采用的推荐算法主要是基于用户行为 的协同过滤算法(Collaborative Filtering,CF),而协同过滤算法又按照是否利用学习模型分为基 于邻域的协同过滤算法(Neighborhood basedCF)和基于机器学习模型的协同过滤算法(Model based CF)。其中基于机器学习模型的方案因为能够提供高质量的推荐效果逐渐受到工业界和 学术界的关注,特别是基于矩阵分解模型的方法和基于深度学习模型的方法。然而这类基于机 器学习模型的方法通常需要一个包含正负样本的样本集对模型进行学习,才能提供准确的推荐 效果。

目前已有的基于机器学习模型的推荐算法通常都是基于用户对物品的评分来训练模型参 数,通过评分值来反映用户对物品的喜爱程度。例如最常用的五星评分方式,5分表示非常喜 欢,1分表示非常不喜欢,中间分数表示喜爱程度逐次递减,这种5分评分形式所得到的用户 行为数据称作显式反馈数据,它能明显地反映用户的态度。然而在实际应用中,有许多应用场 景没有明确的评分机制,例如新闻网页的推荐中,只有用户是否浏览过该新闻的信息;音乐推 荐中只有用户是否播放过该歌曲的信息。这样的用户行为信息被称为隐式反馈信息。对于这类 隐式反馈信息,构建的用户-物品行为矩阵如图1所示,当用户u对物品i有行为的时候,对应 的元素值为1,作为正样本,但是有大量的物品用户没有发生过行为,对于这类物品,不能直 接将其元素值设为0,作为负样本。这是因为没有发生过行为,并不能表示用户不喜欢这类物 品,还有可能是用户不知道物品,因此只能作为未知物品处理。购买、观看、收听、浏览、转 发等行为都可能导致这种只有正样本的情况发生,这类行为被称为隐式反馈。在利用这类隐式 反馈信息来进行推荐的算法中,通常首先需要解决负样本选择问题,即从用户未发生行为的物 品中,选择那些用户更有可能不喜欢的物品作为负样本,即将选为负样本的物品对应的元素值 设为0,这个问题被称为“单类协同过滤问题”。如图1所示,假设有5个用户U1,U2,U3, U4,U5,观看电影的记录如图1左边的矩阵所示,观看了相应的电影,相应的元素值为1,没 有观看的电影的元素值设为“?”,经过负样本选择算法,可推测用户U1很可能不喜欢《星际 争霸》和《海贼王》,因此将其对应的元素值填为0,如图1中右边的矩阵所示,选择一个用户 没有行为的物品集合中的部分物品作为负样本,从而得到一个包含正样本(1值)和负样本(0值) 的数据集。在学习模型参数时,需要同时考虑正负样本的预测差值最小化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710285697.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top