[发明专利]一种行为预测模型训练方法、装置、设备及存储介质在审
申请号: | 202011629448.1 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112669078A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 尚斌;付睿;沈翔宇 | 申请(专利权)人: | 上海众源网络有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 吕俊秀 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行为 预测 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种行为预测模型训练方法,其特征在于,所述方法包括:
获取当前周期的训练数据,所述训练数据中包括样本用户的样本用户特征、样本视频的样本视频特征及所述样本用户在所述当前周期内对所述样本视频的真实行为特征;
将所述样本用户特征及所述样本视频特征输入至行为预测模型,计算所述样本用户对所述样本视频的预测行为特征,所述行为预测模型为对所述当前周期之前的至少一个周期的历史训练数据进行训练得到的;
根据所述预测行为特征与所述真实行为特征之间的损失值,调整所述行为预测模型的模型参数,以使所述预测行为特征与所述真实行为特征之间的损失值满足预设条件,得到新的行为预测模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述预测行为特征与所述真实行为特征之间的损失值,调整所述行为预测模型的模型参数,得到新的行为预测模型,包括:
建立所述预测行为特征与所述真实行为特征之间的损失函数,根据所述损失函数,计算出预测梯度信息;
获取预先存储的所述行为预测模型的历史梯度信息,根据所述历史梯度信息及所述预测梯度信息,计算当前梯度信息;
利用所述当前梯度信息,对所述行为预测模型进行反向传播,调整所述行为预测模型的模型参数,以使所述预测行为特征与所述真实行为特征之间的损失值满足预设条件,得到新的行为预测模型,并将所述当前梯度信息存储为所述新的行为预测模型的历史梯度信息。
3.根据权利要求2所述的方法,其特征在于,所述将所述样本用户特征及所述样本视频特征输入至行为预测模型,计算所述样本用户对所述样本视频的预测行为特征,包括:
将所述训练数据分为多组,其中,每组包括第一预设数量个训练数据;
从所述多组训练数据中选择一组,作为目标训练数据;
将所述目标训练数据中的样本用户特征及样本视频特征输入至行为预测模型,计算所述目标训练数据中样本用户对样本视频的目标预测行为特征;
所述建立所述预测行为特征与所述真实行为特征之间的损失函数,根据所述损失函数,计算出预测梯度信息,包括:
建立所述目标预测行为特征与所述目标训练数据中真实行为特征之间的损失函数,根据所述目标损失函数,计算出预测梯度信息;
在所述将所述当前梯度信息存储为所述新的行为预测模型的历史梯度信息之后,所述方法还包括:
从所述多组训练数据中选择新的一组,作为新的目标训练数据,返回所述将所述目标训练数据中的样本用户特征及样本视频特征输入至行为预测模型,计算所述目标训练数据中样本用户对样本视频的目标预测行为特征的步骤。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取到目标用户的目标用户特征及候选视频的候选视频特征之后,将所述目标用户特征及所述候选视频特征输入至最新的行为预测模型中,计算所述目标用户对所述候选视频的目标行为特征;
根据所述目标行为特征,从所述候选视频中选择目标视频,向所述目标用户推荐所述目标视频。
5.根据权利要求4所述的方法,其特征在于,所述目标行为特征包括所述目标用户对每个候选视频的点击概率,所述根据所述目标行为特征,从所述候选视频中选择目标视频,向所述目标用户推荐所述目标视频,包括:
根据所述目标用户对每个候选视频的点击概率,从所述候选视频中选择点击概率最大的第二预设数量个视频作为目标视频,向所述目标用户推荐所述目标视频。
6.一种行为预测模型训练装置,其特征在于,所述装置包括:
数据获取模块,用于获取当前周期的训练数据,所述训练数据中包括样本用户的样本用户特征、样本视频的样本视频特征及所述样本用户在所述当前周期内对所述样本视频的真实行为特征;
模型计算模块,用于将所述样本用户特征及所述样本视频特征输入至行为预测模型,计算所述样本用户对所述样本视频的预测行为特征,所述行为预测模型为对所述当前周期之前的至少一个周期的历史训练数据进行训练得到的;
参数调整模块,用于根据所述预测行为特征与所述真实行为特征之间的损失值,调整所述行为预测模型的模型参数,以使所述预测行为特征与所述真实行为特征之间的损失值满足预设条件,得到新的行为预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海众源网络有限公司,未经上海众源网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011629448.1/1.html,转载请声明来源钻瓜专利网。