[发明专利]一种模型训练方法、装置、设备及存储介质在审
申请号: | 202010141139.3 | 申请日: | 2020-03-03 |
公开(公告)号: | CN111368195A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 成梭宇 | 申请(专利权)人: | 上海喜马拉雅科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201203 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 设备 存储 介质 | ||
本发明公开了一种模型训练方法、装置、设备及存储介质。其中,该方法包括:从数据库获取M条样本数据,其中,样本数据包括用户标识、信息标识、至少两个用户行为的标签,M为大于等于1的整数,根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数,根据M条样本数据的至少两个行为损失函数确定损失函数L,根据损失函数L训练预测模型。这样可以考虑到多种用户行为之间的耦合关系,通过多种用户行为辅助预测模型,可以提高预测模型预测的准确性。
技术领域
本发明实施例涉及信息处理技术,尤其涉及一种模型训练方法、装置、设备及存储介质。
背景技术
在信息推荐领域,通常需要通过训练模型以实现向用户推荐各类信息。但是,目前常用的方式是单独使用用户的某种特定行为来训练模型,例如,使用展示和点击数据单独训练预测用户点击率的模型,或者使用展示和播放数据单独训练用户播放率的模型,这种方式只采用单一的用户行为进行模型训练与决策,基于模型向用户推荐各类信息的准确度不高。
发明内容
本发明提供一种模型训练方法、装置、设备及存储介质,能够考虑到多种用户行为之间的耦合关系,通过多种用户行为辅助预测模型,可以提高预测模型预测的准确性。
第一方面,本发明实施例提供了一种模型训练方法,该方法包括:
从数据库获取M条样本数据,其中,样本数据包括用户标识、信息标识、至少两个用户行为的标签,其中,M为大于等于1的整数;
根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数;
根据M条样本数据的至少两个行为损失函数确定损失函数L;
根据损失函数L训练预测模型。
第二方面,本发明实施例还提供了一种模型训练装置,该装置包括:
获取模块,用于从数据库获取M条样本数据,样本数据包括用户标识、信息标识、至少两个用户行为的标签,其中,M为大于等于1的整数;
确定模块,用于根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数;
确定模块,还用于根据M条样本数据的至少两个行为损失函数确定损失函数L;
训练模块,用于根据损失函数L训练预测模型。
第三方面,本发明实施例还提供了一种设备,该设备包括:
存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,当处理器执行计算机程序时,实现如本发明第一方面提供的模型训练方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当该计算机程序被处理器执行时,实现如本发明第一方面提供的模型训练方法。
本发明实施例提供了一种模型训练方法、装置、设备及存储介质,具体为从数据库获取M条样本数据,其中,样本数据包括用户标识、信息标识、至少两个用户行为的标签,M为大于等于1的整数,根据至少两个用户行为的标签确定M条样本数据的至少两个行为损失函数其中,k表示第k条样本数据,1≤k≤M,n表示用户行为数,n为大于1的整数,根据M条样本数据的至少两个行为损失函数确定损失函数L,根据损失函数L训练预测模型。这样可以考虑到多种用户行为之间的耦合关系,通过多种用户行为辅助预测模型,可以提高预测模型预测的准确性。
附图说明
图1是本发明实施例中的模型训练方法流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海喜马拉雅科技有限公司,未经上海喜马拉雅科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010141139.3/2.html,转载请声明来源钻瓜专利网。