[发明专利]一种视频推荐的方法及相关设备有效
申请号: | 202010193915.4 | 申请日: | 2019-09-16 |
公开(公告)号: | CN111400601B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 屈冰欣;郑茂 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/735;G06F16/783 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 推荐 方法 相关 设备 | ||
本申请实施例提供了一种视频推荐的方法及相关设备,可以提高视频的语义表征,从而为用户推荐更加贴合用户兴趣的视频。该方法包括:确定目标图像特征向量;确定目标文本特征向量;确定目标音频特征向量;基于所述目标图像特征向量、所述目标文本特征向量以及所述目标音频特征向量,通过目标语义转换模型得到所述目标视频的语义表征,所述目标语义转换模型与所述目标图像特征、所述目标文本特征以及所述目标音频特征相对应;当所述目标视频的语义表征与所述目标对象的兴趣画像相匹配时,向所述目标对象推送所述目标视频。
本申请要求于2019年09月16日提交的、申请号为201910872376.4、发明名称为“一种视频推荐的方法及相关设备”的专利申请的分案申请。
技术领域
本申请涉及信息处理领域,尤其涉及一种视频推荐的方法及相关设备。
背景技术
互联网时代催生了视频的产生及迅速膨胀,随着视频信息量的大幅增长,使得用户在面对大量视频是无法从中获得自己真正感兴趣的内容。
现有的技术方案,通过对视频在图像、音频、文本等各个单模态进行单独的训练,得到各个单模态的视频表征,最后进行基本的拼接得到最终视频表征,之后根据视频表征为用户推荐视频。
然而通过单模态进行单独训练,并未考虑到模态之间的信息交互和交流,最终的视频表征效果不能很好的贴合视频所要表达的内容,进而使得推荐给用户的视频并不贴合用户的兴趣。
发明内容
本申请提供了一种视频推荐的方法及相关设备,可以提高视频的语义表征,从而为用户推荐更加贴合用户兴趣的视频。
本申请实施例第一方面提供一种视频推荐的方法,所述方法包括:
确定目标图像特征向量,所述目标图像特征向量为目标视频对应的图像特征向量,所述目标视频为待向目标对象推荐的视频,所述目标图像特征向量包括所述目标视频对应的视频图像帧的通道信息以及光流信息;
确定目标文本特征向量,所述目标文本特征向量为所述目标视频对应的文本特征向量,所述目标文本特征向量包括所述目标视频的标题信息以及所述目标视频关联音频的属性信息;
确定目标音频特征向量,所述目标音频特征向量为所述目标视频对应的音频特征向量;
基于所述目标图像特征向量、所述目标文本特征向量以及所述目标音频特征向量,通过目标语义转换模型得到所述目标视频的语义表征,所述目标语义转换模型与所述目标图像特征、所述目标文本特征以及所述目标音频特征相对应;
当所述目标视频的语义表征与所述目标对象的兴趣画像相匹配时,向所述目标对象推送所述目标视频。
可选地,所述方法还包括:
步骤1)确定多个视频中每个视频的图像特征向量、文本特征向量以及音频特征向量;
步骤2)初始化语义转换模型;
步骤3)基于第一视频的第一图像特征向量、第一文本特征向量以及第一音频特征向量,通过初始化后所述语义转换模型得到所述第一视频的语义表征,所述第一视频为所述多个视频中的任意一个视频;
步骤4)更新所述语义转换模型的损失函数;
迭代执行步骤3)至步骤4),直至达到预置的迭代终止条件,且将达到所述预置的迭代终止条件的语义转换模型确定为所述目标语义转换模型。
可选地,所述基于第一视频的第一图像特征向量、第一文本特征向量以及第一音频特征向量,通过初始化后所述语义转换模型得到所述第一视频的语义表征之前,所述方法还包括:
确定所述第一图像特征向量的概率分布、所述第一文本特征向量的概率分布以及所述第一音频特征向量的概率分布;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010193915.4/2.html,转载请声明来源钻瓜专利网。