[发明专利]一种针对购物节的搜索广告转化率预测方法及装置有效
申请号: | 202010146512.4 | 申请日: | 2020-03-05 |
公开(公告)号: | CN111352976B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 赖粤;钱毅霖;余荣;吴茂强 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06N20/00;G06Q30/0201;G06Q30/0242 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 黄忠 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 购物 搜索 广告 转化 预测 方法 装置 | ||
本申请公开了一种针对购物节的搜索广告转化率预测方法及装置,包括:获取购物节当天以及购物节之前的购物数据集;将购物节之前的购物数据集作为第一训练集,训练广告转化率模型,预测得到购物节当天的第一预测结果;将购物节当天的部分时间的购物数据集作为第二训练集,将购物节当天的另一部分时间的购物数据集作为测试集,将第二训练集中的部分数据作为验证集,将第一预测结果作为新特征分别加入到第二训练集、验证集以及测试集中;训练广告转化率模型,得到购物节当天的最终预测结果。解决了日常时期构建的训练集预测购物节时期构建的测试集导致预测结果不准确的问题。
技术领域
本申请涉及数据挖掘技术领域,尤其涉及一种针对购物节的搜索广告转化率预测方法及装置。
背景技术
搜索广告是根据用户搜索行为在返回界面中展现的与搜索词相关的广告。电商平台作为一个复杂的系统,会受到各种因素的影响。在诸如双十一、618等大型购物节,商家和平台的各种活动会导致流量分布的急剧变化,我们称这种特殊时期的广告转化相关数据为特殊流量。而日常时期训练的模型很难有效地匹配特殊流量。
对于该类问题,与本发明最相似的实现方案是把转化率预测当做传统的回归预测问题,通过滑动时间窗口的方法对数据集进行划分,使用多个不同机器学习算法作为模型,运用Stacking方法进行融合,得到最终的结果。
现有技术常常将传统的回归问题预测方法不加修改地迁移到转化率预测问题上来,或者很少对日常时期和大型购物节时期两种数据分布下的转化率预测方法加以区分。因此,现有技术存在以下几个缺点,包括:1、没有针对大型购物节时期的特殊数据分布进行适配,而是直接用日常时期构建的训练集预测购物节时期构建的测试集。由于日常时期数据集中平均转化率较低,如果用它来预测高转化率的测试集,可以想见预测结果会偏低;2、对高维特征采用独热向量编码,或是不加区分地对所有特征都采用同一种方法进行编码,这些编码方法效果都不够好,还有很大的提升空间;3、现有方案使用固定的时间窗口滑窗提取特征,但购物节及其附近时期存在多种不同的数据分布,需要进行另一种方式的数据集划分,避免造成数据的浪费;4、现有方案在计算转化率特征时采用贝叶斯平滑法进行平滑处理,但这种方法计算参数的时间较长,当转化率特征较多时,效率将严重下降,需要另行采取时间上更快的平滑方法;5、现有方案采取多种不同机器学习算法分别预测,采用加权或Stacking方法对多个模型进行融合。多模型预测的缺点是虽然精度比较高,但会耗费更多的时间,同时可能还需要构建不同的特征工程;融合方法的缺点是:①加权方法权重不容易确定;②Stacking方法对包含时间序列因素的数据集会有数据穿越问题。
发明内容
本申请提供了一种针对购物节的搜索广告转化率预测方法及装置,使得解决了日常时期构建的训练集预测购物节时期构建的测试集导致预测结果不准确的问题。
有鉴于此,本申请第一方面提供了一种针对购物节的搜索广告转化率预测方法,所述方法包括:
获取购物节当天以及购物节之前的购物数据集;
将所述购物节之前的购物数据集作为第一训练集,训练广告转化率模型,预测得到购物节当天的第一预测结果;
将购物节当天的部分时间的所述购物数据集作为第二训练集,将购物节当天的另一部分时间的所述购物数据集作为测试集,将所述第二训练集中的部分数据作为验证集,将所述第一预测结果作为新特征分别加入到所述第二训练集、所述验证集以及所述测试集中;
采用加入新特征的所述第二训练集、所述验证集以及所述测试集训练所述广告转化率模型,得到购物节当天的最终结果。
可选的,在所述将购物节之前的购物数据集作为第一训练集,训练所述广告转化率模型,预测得到购物节当天的第一预测结果,之前还包括:
将所述购物数据集中的数据进行预处理,得到符合广告转化率模型输入格式的数据。
可选的,所述将所述购物数据集中的数据进行预处理具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010146512.4/2.html,转载请声明来源钻瓜专利网。