[发明专利]一种视频推荐方法及装置有效
申请号: | 201810637661.3 | 申请日: | 2018-06-20 |
公开(公告)号: | CN108875022B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 雷迦吟 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘新雷;王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 推荐 方法 装置 | ||
本申请公开的视频推荐方法及装置,通过训练得到的深度学习模型能够使得曝光但用户未点击的视频测试集中至少一个第一视频的预测点击率大于预设点击率阈值,预测点击率大于所述点击率阈值的第一视频为与曝光且用户点击过的视频测试集中至少一个第二视频相关的视频,且第一视频的点击率小于第二视频的点击率,这样深度学习模型可以将候选推荐视频中,与用户兴趣点契合的点击率较高和点击率较低的视频均选择出来,进而推荐给用户。因此,本申请提供的视频推荐方法,既能从候选推荐视频中推荐出用户喜好的视频,又可以解决新视频冷启动问题。
技术领域
本发明涉及数据处理领域,更具体地说,涉及一种视频推荐方法及装置。
背景技术
目前,利用用户与视频的对应关系的历史数据,来训练机器学习模型,进而利用训练好的机器学习模型来分析哪些视频是用户喜欢的视频,以将用户喜欢的视频推荐给用户。但是,依据历史数据训练好的机器学习模型,分析出来的用户喜欢的视频,会偏向于高点击率的视频。
例如用户以往看的都是悬疑类型的视频,则给用户推荐的视频都是与用户以往看的悬疑类型相关且点击率较高的悬疑类型的视频,而对于与用户以往看的悬疑类型相关但点击率较低的悬疑类型的视频,则无法推荐给用户,这样会导致点击率较低的视频得不到一定的曝光,进而导致点击率较低的视频没有曝光点击数据支撑。在点击率较低的视频没有曝光点击数据支撑的情况下,现有机器学习模型更不会将点击率较低的视频推荐给用户,从而形成了恶性循环,特别对于经常有新视频上线的视频网站十分不利。
发明内容
有鉴于此,本发明提出一种视频推荐方法及装置,欲实现推荐与用户兴趣点契合的点击率较低的视频目的。
为了实现上述目的,现提出的方案如下:
一种视频推荐方法,包括:
获取用户身份标识和多个候选推荐视频;
获取模型输入数据,所述模型输入数据包括所述多个候选推荐视频各自对应的第一特征信息以及所述用户身份标识对应的第二特征信息;
将所述模型输入数据输入预先训练得到的深度学习模型,得到所述深度学习模型输出的每个所述候选推荐视频的预测点击率,其中训练得到的所述深度学习模型使得曝光但用户未点击的视频测试集中至少一个第一视频的预测点击率大于预设点击率阈值,预测点击率大于所述点击率阈值的第一视频为与曝光且用户点击过的视频测试集中至少一个第二视频相关的视频,第一视频的点击率小于第二视频的点击率;
根据每个候选推荐视频的预测点击率,选取至少一个候选推荐视频作为目标推荐视频输出。
可选的,所述深度学习模型的训练过程,包括:
获取曝光且用户点击过的视频训练集中每个第二视频各自对应的第一特征信息、曝光但用户未点击的视频训练集中每个第一视频各自对应的第一特征信息、以及用户身份标识对应的第二特征信息;
将获得的每个第二视频各自对应的第一特征信息和用户身份标识对应的第二特征信息组合一起作为正样本;
将获得的每个第一视频各自对应的第一特征信息和用户身份标识对应的第二特征信息组合一起作为负样本;
利用所述正样本和所述负样本对初始深度学习模型进行训练,得到符合要求的所述深度学习模型。
可选的,在所述深度学习模型的训练过程中,所述正样本和所述负样本的比例在1:50至1:150之间。
可选的,所述用户身份标识对应的第二特征信息包括:视频播放设备信息、用户会员等级信息、用户家庭成员信息、用户活跃度信息、用户各种类型频道的观看时长信息、用户点击视频对应的第一特征信息、用户收藏视频对应的第一特征信息和用户搜索视频对应的第一特征信息中的至少一种;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810637661.3/2.html,转载请声明来源钻瓜专利网。