[发明专利]用于训练点击率预估模型的方法和装置在审
申请号: | 201910083845.4 | 申请日: | 2019-01-29 |
公开(公告)号: | CN111488517A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 李思雯;严严 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100076 北京市大兴区经济技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 训练 点击率 预估 模型 方法 装置 | ||
本申请实施例公开了用于训练点击率预估模型的方法和装置。该方法的一具体实施方式包括获取训练样本,其中,训练样本包括训练样本信息和训练样本标签,训练样本标签用于标识训练样本信息的点击情况;获取训练样本的样本权重;利用训练样本和样本权重对初始点击率预估模型进行训练,得到点击率预估模型。该实施方式提高了点击率预估模型的预估准确度。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于训练点击率预估模型的方法和装置。
背景技术
信息推送,就是“网络广播”,是通过一定的技术标准或协议,在互联网上通过主动传送用户需要的信息来减少信息过载的一项新技术。推送技术通过自动传送信息给用户,来减少用于网络上搜索的时间。它根据用户的兴趣来搜索、过滤信息,并将其主动推给用户,帮助用户高效率地发掘有价值的信息。
目前,通常是通过分析海量的历史浏览信息来确定用户的兴趣点,并基于确定出的兴趣点为用户推送信息。然而,随着时间的推移,用户的兴趣点会不断的变化。比如,用户近期准备去度假,如果当前给用户推送的信息是其历史购买过的品类(如图书、洗发露、收音机等)的信息,用户点击推送信息的概率较小;如果当前给用户推送的信息是其最近经常浏览的品类(如墨镜、连衣裙、遮阳伞、防晒霜等)的信息,用户点击推送信息的概率较大。随着时间的推移,全部历史浏览信息中目标变量的统计特性会以不可预见的方式发生变化,从而导致确定出的兴趣点随着时间的变化准确度逐渐变低。
发明内容
本申请实施例提出了用于训练点击率预估模型的方法和装置。
第一方面,本申请实施例提供了一种用于训练点击率预估模型的方法,包括:获取训练样本,其中,训练样本包括训练样本信息和训练样本标签,训练样本标签用于标识训练样本信息的点击情况;获取训练样本的样本权重;利用训练样本和样本权重对初始点击率预估模型进行训练,得到点击率预估模型。
在一些实施例中,获取训练样本的样本权重,包括:获取训练样本信息的历史浏览时间,其中,样本信息是历史浏览信息;基于历史浏览时间,确定样本权重。
在一些实施例中,基于历史浏览时间,确定样本权重,包括:基于历史浏览时间,计算样本半衰期;基于牛顿冷却定律和样本半衰期,计算样本权重。
在一些实施例中,基于历史浏览时间,计算样本半衰期,包括:获取候选样本半衰期和预测样本,其中,预测样本包括预测样本信息和预测样本标签,预测样本标签用于标识预测样本信息的点击情况;基于牛顿冷却定律和候选样本半衰期,计算候选样本权重;利用训练样本和候选样本权重对初始点击率预估模型进行训练,得到候选点击率预估模型;将预测样本信息输入至候选点击率预估模型,得到预测样本信息的预估点击率;基于预估点击率和预测样本标签,计算候选半衰期对应的正样本排在负样本前面的概率;基于正样本排在负样本前面的概率,从候选样本半衰期中确定样本半衰期。
在一些实施例中,利用训练样本和样本权重对初始点击率预估模型进行训练,得到点击率预估模型,包括:基于训练样本和样本权重对初始点击率预估模型的交叉熵损失函数进行改进,得到代价函数;将代价函数引入初始点击率预估模型,得到改进初始点击率预估模型;将训练样本信息和样本权重作为输入,将训练样本标签作为输出,对改进初始点击率预估模型进行训练,得到点击率预估模型。
在一些实施例中,该方法还包括:获取候选推送信息;将候选推送信息输入至点击率预估模型,得到候选推送信息的预估点击率;基于预估点击率,从候选推送信息中确定推送信息,以及推送推送信息。
第二方面,本申请实施例提供了一种用于训练点击率预估模型的装置,包括:样本获取单元,被配置成获取训练样本,其中,训练样本包括训练样本信息和训练样本标签,训练样本标签用于标识训练样本信息的点击情况;权重获取单元,被配置成获取训练样本的样本权重;模型训练单元,被配置成利用训练样本和样本权重对初始点击率预估模型进行训练,得到点击率预估模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910083845.4/2.html,转载请声明来源钻瓜专利网。