[发明专利]模型训练方法、装置、多媒体推荐方法、设备及存储介质在审
申请号: | 202210470106.2 | 申请日: | 2022-04-28 |
公开(公告)号: | CN115114462A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 袁宇辰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F16/9535;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 多媒体 推荐 设备 存储 介质 | ||
本申请的多媒体特征提取模型的训练方法包括:从多个多媒体中确定多个训练样本,每个训练样本包括锚点多媒体、第一多媒体以及第二多媒体;锚点多媒体为多个多媒体中的任一个;第一多媒体对应的第一对象集合与锚点多媒体对应的锚点对象集合相交;第二多媒体对应的第二对象集合与锚点对象集合不相交;对多个训练样本进行排序处理,得到目标样本矩阵;将目标样本矩阵输入预设多媒体特征提取模型,进行特征提取处理,得到多媒体特征矩阵;根据多媒体特征矩阵,确定三重态损失信息;基于三重态损失信息训练预设多媒体特征提取模型,得到目标多媒体特征提取模型。在多媒体侧训练样本的生成过程中引入对象信息,可提升目标多媒体特征提取模型的精准度。
技术领域
本发明涉及计算机技术领域,具体涉及模型训练方法、装置、多媒体推荐方法、设备及存储介质。
背景技术
在多媒体推荐领域(如广告推荐领域),现有的多媒体推荐系统分别独立地生成多媒体侧特征和对象侧特征,即,将多媒体侧特征和对象侧特征分开生成。以多媒体侧特征中常用的多模态特征embedding(嵌入特征)为例,对应的多媒体侧特征生成模型一般以多媒体本身的多模态素材作为输入(视频帧、标题、音频等)进行训练。多媒体侧特征生成模型收敛后,测试阶段中,输入一段测试多媒体的多模态素材,根据业务需要输出模型中间某层的输出结果,将其整体作为一个多维特征embedding,将其与对象侧特征生成模型生成的对象特征一起作为推荐模型中后续模型的输入,得到推荐多媒体。
可见,现有多媒体推荐技术中,多媒体侧特征生成的过程与对象侧无关,没有充分发掘对象信息和多媒体素材,导致多媒体推荐精准性低,无法向对象推送符合对象需求的多媒体。
发明内容
有鉴于上述存在的技术问题,本申请提出了一种模型训练方法、装置、多媒体推荐方法、设备及存储介质。
根据本申请的一方面,提供了一种多媒体特征提取模型的训练方法,包括:
从多个多媒体中确定多个训练样本,每个训练样本包括锚点多媒体、第一多媒体以及第二多媒体;所述锚点多媒体为所述多个多媒体中的任一个;所述第一多媒体对应的第一对象集合与所述锚点多媒体对应的锚点对象集合相交;第二多媒体对应的第二对象集合与所述锚点对象集合不相交;
对所述多个训练样本进行排序处理,得到目标样本矩阵;
将所述目标样本矩阵输入预设多媒体特征提取模型,进行特征提取处理,得到多媒体特征矩阵,所述多媒体特征矩阵的行数和所述目标样本矩阵的行数相同;
根据所述多媒体特征矩阵,确定三重态损失信息;
基于所述三重态损失信息训练所述预设多媒体特征提取模型,直至满足预设条件,得到目标多媒体特征提取模型。
根据本申请的另一方面,提供了一种多媒体推荐方法,包括:
确定待推荐对象和所述待推荐对象对应的目标多媒体;
将所述目标多媒体输入目标多媒体特征提取模型,对所述目标多媒体进行特征提取处理,得到所述目标多媒体对应的多媒体特征,其中,所述目标多媒体特征提取模型是根据上述的训练方法得到的;
将所述目标多媒体对应的多媒体特征输入预测模型,根据所述目标多媒体对应的多媒体特征对多个预设多媒体进行预测处理,得到所述多个预设多媒体各自的预测概率;
根据所述多个预设多媒体各自的预测概率,从所述多个预设多媒体中确定待推荐多媒体;
向所述待推荐对象推荐所述待推荐多媒体。
根据本申请的另一方面,提供了一种多媒体特征提取模型训练装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210470106.2/2.html,转载请声明来源钻瓜专利网。