[发明专利]一种用于媒体数据推荐的模型训练方法及装置在审
申请号: | 202110952591.2 | 申请日: | 2021-08-18 |
公开(公告)号: | CN113705782A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 李霞;周星杰 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F16/9535 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 曾军;吴雪 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 媒体 数据 推荐 模型 训练 方法 装置 | ||
1.一种用于媒体数据推荐的模型训练方法,其特征在于,所述推荐模型包括:第一子模型、第二子模型和预测子模型,所述方法包括:
获取训练样本和与所述训练样本对应的标签,其中,所述训练样本包括:根据历史投放对象数据生成的第一子样本、和历史媒体数据生成的第二子样本,所述标签表示出历史上投放对象是否针对所述第二子样本表示出的媒体数据执行过指定操作;
将所述第一子样本输入所述第一子模型,得到投放对象待定特征,并将所述第二子样本输入所述第二子模型,得到媒体数据待定特征;
将所述投放对象待定特征和所述媒体数据待定特征输入所述预测子模型,得到待定预测结果;
将本次迭代中第一子模型的第一待定参数、第二子模型的第二待定参数、以及所述待定预测结果确定为训练数据子集,并存储;
针对存储的每个训练数据子集,根据所述训练子集中的待定预测结果和所述标签的差异,确定所述训练数据子集的分值,其中,所述分值与训练数据子集对应的推荐模型的模型性能正相关;
采用分值最高的训练数据子集中的第一待定参数和第二待定参数,分别更新所述第一子模型和所述第二子模型,得到更新后的推荐模型;
根据所述训练样本继续训练所述更新后的推荐模型,直至满足收敛条件,得到训练后的推荐模型。
2.根据权利要求1所述的方法,其特征在于,根据所述训练子集中的待定预测结果和所述标签的差异,确定所述训练数据子集的分值,包括:
确定本次迭代经历的时长,作为指定时长,并确定所述训练子集中的待定预测结果和所述标签的差异;
根据所述指定时长和所述差异,确定所述训练数据子集的分值,其中,所述分值与所述指定时长负相关。
3.根据权利要求1所述的方法,其特征在于,
所述第一子样本包括:行为序列、和所述行为序列对应的投放对象的属性,其中,所述行为序列包括若干个节点,所述节点表示出投放对象执行的指定操作针对的媒体数据,所述节点在所述行为序列中的次序表示出投放对象针对媒体数据执行指定操作的次序;
所述第二子样本包括:媒体样本数据的属性,其中,在所述媒体样本数据与所述节点对应的媒体数据的相似度大于相似度阈值时,所述第二子样本所属的训练样本是正样本,若反之,则所述第二子样本所属的训练样本是负样本。
4.根据权利要求1所述的方法,其特征在于,
将本次迭代中第一子模型的第一待定参数、第二子模型的第二待定参数、以及所述待定预测结果确定为训练数据子集,包括:将本次迭代中第一子模型的第一待定参数、第二子模型的第二待定参数、预测子模型的第三待定参数、以及所述待定预测结果确定为训练数据子集;
采用分值最高的训练数据子集中的第一待定参数和第二待定参数,分别更新所述第一子模型和所述第二子模型,包括:采用分值最高的训练数据子集中的第一待定参数、第二待定参数、以及第三待定参数,分别更新所述第一子模型、所述第二子模型、以及预测子模型。
5.根据权利要求1所述的方法,其特征在于,将所述第一子样本输入所述第一子模型,得到投放对象待定特征,并将所述第二子样本输入所述第二子模型,得到媒体数据待定特征之前,所述方法还包括:
若本次迭代为模型训练过程中的首次迭代,则初始化所述第一子模型和所述第二子模型的模型参数;
若本次迭代为模型训练过程中的非首次迭代,则根据上次迭代得到的训练数据子集,更新所述第一子模型和所述第二子模型,采用指定方式对所述更新后的第一子模型和第二子模型的至少部分模型参数进行调整。
6.根据权利要求1至5任一所述的方法,其特征在于,
所述第一子模型、第二子模型中的至少一个,是残差神经网络;和/或,
所述投放对象是用户,所述指定操作是点击操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110952591.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置