[发明专利]生成点击率预估模型的方法及预测点击概率的方法有效
申请号: | 201910491225.4 | 申请日: | 2019-06-06 |
公开(公告)号: | CN112055038B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 陈冠豪;王路路;孟晓楠 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04L67/1396 | 分类号: | H04L67/1396;H04L41/14 |
代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 梁燕飞 |
地址: | 开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 点击率 预估 模型 方法 预测 点击 概率 | ||
本发明公开了生成点击率预估模型的方法及预测点击概率的方法。其中,生成点击率预估模型的方法包括步骤:获取与用户点击目标元素相关的特征数据及特征数据对应的流量标识;将特征数据输入第一点击率预估模型中进行训练,得到训练后的基础网络组件,其中第一点击率预估模型包括相互耦接的基础网络组件和分数计算组件;以及将特征数据及其对应的流量标识输入第二点击率预估模型,并通过流量标识对第二点击率预估模型进行训练,以得到训练后的第二点击率预估模型作为所生成的点击率预估模型,其中第二点击率预估模型包括相互耦接的训练后的基础网络组件和多源迁移组件。本发明一并公开了相应的计算设备。
技术领域
本发明涉及信息处理技术领域,尤其涉及生成点击率预估模型的方法及预测点击概率的方法。
背景技术
随着互联网技术的快速发展,点击率(click-through rate,CTR)已经成为互联网平台进行流量分配的核心依据之一。以在互联网平台上投放广告为例,根据用户对广告的历史点击信息,分析用户的兴趣和行为,进而预测用户的未来点击行为,以促进广告的准确投放。这对保障用户、广告方、平台三方的利益来说,是不可或缺的。
简单来说,点击率就是网站页面上某一内容被点击的次数与被显示次数之比。目前常见的点击率预估方案,是采集各种样本数据,通过机器学习算法来训练出一个统一的点击率预估模型。然而,由于场景和用户的差异,导致来自不同渠道的样本数据,其分布的均值和方差均存在差异。例如,有的样本数据来自站内流量、有的样本数据来自站外付费流量,又如,有的样本数据来自浏览器页面、有的样本数据来自移动应用页面,这些都会影响用户的点击行为。另一方面,从机器学习的角度来看,这种处理方案更倾向于学习数据量(或数据质量)较大的样本,而对小样本的训练存在偏差。
因此,需要一种点击率预估方案,能够很好地解决样本数据分布差异的问题。
发明内容
为此,本发明提供了生成点击率预估模型的方法及预测点击概率的方法,以力图解决或至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种生成点击率预估模型的方法,包括步骤:获取与用户点击目标元素相关的特征数据及特征数据对应的流量标识;将特征数据输入第一点击率预估模型中进行训练,得到训练后的基础网络组件,其中第一点击率预估模型包括相互耦接的基础网络组件和分数计算组件;以及将特征数据及其对应的流量标识输入第二点击率预估模型,并通过流量标识对第二点击率预估模型进行训练,以得到训练后的第二点击率预估模型作为所生成的点击率预估模型,其中第二点击率预估模型包括相互耦接的训练后的基础网络组件和多源迁移组件。
可选地,在根据本发明的方法中,流量标识用于标识特征数据所对应的流量来源,多源迁移组件包含至少一组第一权重参数,且一组第一权重参数对应一个流量来源。
可选地,根据本发明的方法还包括步骤:分别构建基础网络组件、分数计算组件和多源迁移组件。其中,基础网络组件适于学习特征数据及特征数据之间的特征;分数计算组件适于基于所输入的特征数据,确定用户对目标元素的点击概率;多源迁移组件适于根据流量标识,激活对应的一组第一权重参数,并确定出用户对目标元素的点击概率。
可选地,根据本发明的方法还包括步骤:将特征数据输入所述第一点击率预估模型中进行处理,其中,基础网络组件适于对所输入的特征数据进行卷积处理,以生成特征向量;分数计算组件适于对特征向量进行逻辑回归处理,以确定出用户对目标元素的点击概率;基于所确定的点击概率对第一点击率预估模型进行训练,以得到训练后的第一点击率预估模型。
可选地,在根据本发明的方法中,在训练结束时得到训练后的基础网络组件的步骤包括:基于训练后的第一点击率预估模型,获取关于基础网络组件的第二权重参数;基于初始构建的基础网络组件和所述第二权重参数,生成训练后的基础网络组件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910491225.4/2.html,转载请声明来源钻瓜专利网。