[发明专利]用户点击模型的训练方法、装置、电子设备及存储介质有效
申请号: | 201910956994.7 | 申请日: | 2019-10-10 |
公开(公告)号: | CN110851706B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 万立 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司;上海小度技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F11/34 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 点击 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种用户点击模型的训练方法,其特征在于,包括:
从全网用户的日志数据库中采集数条行为数据,各条所述行为数据中包括预设时间周期内一用户对网络中的资源的反馈信息;
基于预先创建的头部资源库和所述数条行为数据,生成所述数条行为数据对应的数条资源访问特征;各所述行为数据对应的所述资源访问特征包括所述行为数据对应的所述用户,对所述头部资源库中的头部资源标识对应的资源是否为正反馈;
采用所述数条资源访问特征,训练用户点击模型。
2.根据权利要求1所述的方法,其特征在于,基于预先创建的头部资源库和所述数条行为数据,生成所述数条行为数据对应的数条资源访问特征之前,所述方法还包括:
根据全局资源库中的各资源的属性信息,从所述全局资源库中过滤出多个头部资源的标识;
将所述多个头部资源标识组成头部资源库。
3.根据权利要求2所述的方法,其特征在于,根据全局资源库中的各资源的属性信息,从所述全局资源库中过滤出多个头部资源的标识,包括如下至少一种:
根据所述全局资源库中的各资源的质量参数,从所述全局资源库中过滤出质量参数大于预设质量参数阈值的多个资源标识,作为头部资源的标识;
根据所述全局资源库中的各资源的访问热度,从所述全局资源库中过滤出访问热度大于预设热度阈值的多个资源标识,作为头部资源的标识;和
根据所述全局资源库中的各资源的区分度,从所述全局资源库中过滤出区分度大于预设区分度阈值的多个资源标识,作为头部资源的标识;其中各所述资源的区分度等于所述资源对应的不同反馈的用户群体数量的方差;
或者,根据全局资源库中的各资源的属性信息,从所述全局资源库中过滤出多个头部资源的标识,包括如下至少一种:
根据所述全局资源库中的各资源的质量参数,从所述全局资源库中过滤出质量参数最大的Top N个资源标识,作为头部资源的标识;
根据所述全局资源库中的各资源的访问热度,从所述全局资源库中过滤出访问热度最大的Top M个资源标识,作为头部资源的标识;和
根据所述全局资源库中的各资源的区分度,从所述全局资源库中过滤出区分度最大的Top W个资源标识,作为头部资源的标识;其中所述N、M和W均为正整数。
4.根据权利要求1所述的方法,其特征在于,从全网用户的日志数据库中采集数条行为数据,包括:
从所述日志数据库中,通过预设埋点的显式采集方式和/或通过分析用户的对各资源的反馈信息的隐式采集方式,采集所述数条行为数据。
5.根据权利要求1所述的方法,其特征在于,基于预先创建的头部资源库和所述数条行为数据,生成所述数条行为数据对应的数条资源访问特征,包括:
获取各所述行为数据中的所述用户对所述头部资源库中的资源的正反馈信息;
基于各所述行为数据中的所述用户对所述头部资源库中的资源的正反馈信息,生成对应的所述资源访问特征,共得到数条所述资源访问特征。
6.根据权利要求1所述的方法,其特征在于,采用所述数条资源访问特征,训练用户点击模型,包括:
对于各所述资源访问特征,将所述资源访问特征中的部分有效数据遮挡,得到对应的资源访问训练特征;
将所述资源访问训练特征输入至所述用户点击模型,获取所述用户点击模型输出的资源访问预测特征;
基于所述资源访问特征和对应的所述资源访问预测特征,计算交叉熵函数值;
判断所述交叉熵函数值是否等于0;
若不等于0,调整所述用户点击模型的参数,使得所述交叉熵函数值趋于0;
采用所述数条资源访问特征,按照上述方式不断地对所述用户点击模型进行训练,直到所述交叉熵函数值在连续预设次数的训练中都等于0,确定所述用户点击模型的参数,进而确定所述用户点击模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司;上海小度技术有限公司,未经百度在线网络技术(北京)有限公司;上海小度技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910956994.7/1.html,转载请声明来源钻瓜专利网。