[发明专利]模型训练方法及装置、电子设备和介质有效
申请号: | 202110925544.9 | 申请日: | 2021-08-12 |
公开(公告)号: | CN113642635B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 马小龙 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 电子设备 介质 | ||
1.一种用于信息推荐的模型训练方法,包括:
获取离散化的多个待变换的样本标签值,其中所述样本标签值包括用户对于推荐信息的交互行为数据的样本标签值;
确定对所述待变换的样本标签值进行数据变换的约束条件;
通过参数寻优方法确定满足所述约束条件的变换后的样本标签值集合,所述变换后的样本标签值集合中的样本标签值与所述多个待变换的样本标签值一一对应;以及
基于所述变换后的样本标签值集合对所述模型进行训练,其中,所述约束条件根据以下公式表示:
其中,分别为变换前的用户对于所述推荐信息的交互行为数据的样本标签值,分别为变换后的用户对于所述推荐信息的交互行为数据的样本标签值,其中k=1,2,…,n,n为正整数。
2.如权利要求1所述的方法,其中,获取离散化的多个待变换的样本标签值包括:
确定所述待变换的样本标签值的取值范围;以及
在所述取值范围内,基于预设的采样间隔进行离散化取值,以获得所述多个待变换的样本标签值。
3.如权利要求1所述的方法,其中,通过参数寻优方法确定满足所述约束条件的变换后的样本标签值集合包括:
初始化以获得第一数量的样本标签值集合,其中所述第一数量的样本标签值集合中的每一个样本标签值集合包括满足所述约束条件的与所述多个待变换的样本标签值一一对应的多个样本标签值;
分别基于所述第一数量的样本标签值集合对所述模型进行预训练,以得到相应的模型指标;以及
将最优的模型指标所对应的样本标签值集合作为所述变换后的样本标签值集合。
4.如权利要求3所述的方法,其中,通过参数寻优方法确定满足所述约束条件的变换后的样本标签值集合还包括:
执行以下操作一次或多次:
基于所述最优的模型指标所对应的样本标签值集合中的多个样本标签值生成新的第二数量的样本标签值集合;
对所述新的第二数量的样本标签值集合中的不满足所述约束条件的样本标签值进行修正,以使其满足所述约束条件;
分别基于修正后的所述第二数量的样本标签值集合对所述模型进行预训练,以得到相应的模型指标;以及
确定最优的模型指标所对应的样本标签值集合;
将所述最优的模型指标所对应的样本标签值集合作为所述变换后的样本标签值集合。
5.如权利要求4所述的方法,其中,对所述新的第二数量的样本标签值集合中的不满足所述约束条件的样本标签值进行修正包括:
确定变换后的最大样本标签值、变换后的最小样本标签值以及所述参数寻优方法所对应的样本标签值变化间隔;以及
基于所述最大样本标签值、最小样本标签值以及所述最小样本标签值变化间隔对不满足所述约束条件的样本标签值进行修正。
6.如权利要求1所述的方法,其中,基于所述变换后的样本标签值集合对所述模型进行训练包括:
获取训练样本所对应的第一样本标签值;
基于所述变换后的样本标签值集合,通过线性插值方法确定所述第一样本标签值变换后的样本标签值,以基于所述变换后的样本标签值进行模型训练。
7.如权利要求3或4所述的方法,其中,所述模型指标包括由以下项所组成的组中的一个或多个:正逆序比、曲线下面积、均方根误差、平均绝对误差。
8.一种信息推荐方法,包括:
基于如权利要求1-7中任一项所述的方法所训练得到的模型获取预测的用户对于待推荐信息的交互行为数据;以及
基于所述交互行为数据对所述待推荐信息进行推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110925544.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:审计项存储方法、装置以及系统
- 下一篇:一种市政工程用自锁式防盗井盖