[发明专利]预估模型的训练方法及装置有效
申请号: | 202110137591.7 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112949864B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 李爽;谢乾龙;王兴星;王栋 | 申请(专利权)人: | 海南两心科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 571924 海南省澄迈县老城镇经济技术开*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预估 模型 训练 方法 装置 | ||
本公开提供了一种预估模型的训练方法及装置。所述方法包括:根据第一业务方的历史数据,获取第一训练集和第二训练集,并根据第二业务方的历史数据,获取第三训练集;其中,所述第一业务方为曝光量大于第一阈值的业务方,所述第二业务方为曝光量小于第二阈值的业务方,所述第一阈值大于所述第二阈值;基于所述第一训练集对屏蔽了目标子模型的初始预估模型进行训练,得到第一预估模型;基于所述第二训练集对所述第一预估模型中的目标子模型进行训练,得到第二预估模型;基于所述第三训练集对所述第二预估模型进行训练,得到目标预估模型。本公开可以提高长尾流量预估效果,进而提高了商家点击率和转化率的预估准确度。
技术领域
本公开的实施例涉及模型训练技术领域,尤其涉及一种预估模型的训练方法及装置。
背景技术
广告和推荐场景中曝光分布符合经济学中的二八定律,在外卖广告场景中,小商家的数量更多,约30%的头部商家贡献80%的曝光,70%的长尾商家贡献20%的曝光。
现有的点击率、转化率预估是以EmbeddingMLP结构的深度神经网络模型为主,这种深度模型对头部流量优化效果更好,而长尾流量细分到商家粒度的曝光过少,不利于商家Embedding学习,优化效果较差,进而导致商家的点击率、转化率的预估精度较低。
发明内容
本公开的实施例提供一种预估模型的训练方法及装置,用以提高商家的点击率和转化率的预估精度。
根据本公开的实施例的第一方面,提供了一种预估模型的训练方法,包括:
根据第一业务方的历史数据,获取第一训练集和第二训练集,并根据第二业务方的历史数据,获取第三训练集;其中,所述第一业务方为曝光量大于第一阈值的业务方,所述第二业务方为曝光量小于第二阈值的业务方,所述第一阈值大于所述第二阈值;
基于所述第一训练集对屏蔽了目标子模型的初始预估模型进行训练,得到第一预估模型;
基于所述第二训练集对所述第一预估模型中的目标子模型进行训练,得到第二预估模型;
基于所述第三训练集对所述第二预估模型进行训练,得到目标预估模型。
可选地,所述根据第一业务方的历史数据,获取第一训练集和第二训练集,包括:
根据所述第一业务方的历史数据,获取模型训练集;
获取所述模型训练集中第一比例的第一训练样本,并根据所述第一训练样本,得到所述第一训练集;
获取所述模型训练集中第二比例的第二训练样本,并根据所述第二训练样本,得到所述第二训练集;
其中,所述第一比例大于所述第二比例,所述第一比例和第二比例的和值为1。
可选地,所述第一训练集中每个第一训练样本对应于一个第一初始点击率和第一初始转化率,所述基于所述第一训练集对屏蔽了目标子模型的初始预估模型进行训练,得到第一预估模型,包括:
将所述初始预估模型的模型参数调整为第一模型参数,以屏蔽所述目标子模型;
将所述第一训练样本输入至所述初始预估模型,并获取由所述初始预估模型输出的所述第一训练样本对应的第一预测点击率和第一预测转化率;
根据所述第一初始点击率、所述第一预测点击率、所述第一初始转化率和所述第一预测转化率,计算得到所述初始预估模型对应的第一损失值;
在所述第一损失值处于第一预设范围内的情况下,将训练后的初始预估模型作为所述第一预估模型。
可选地,所述基于所述第二训练集对所述第一预估模型中的目标子模型进行训练,得到第二预估模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南两心科技有限公司,未经海南两心科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110137591.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双角钢T形组合截面输电塔加固装置
- 下一篇:差异识别模型的训练方法及装置