[发明专利]基于FM算法的CTR预估方法及系统有效
申请号: | 201810599540.4 | 申请日: | 2018-06-12 |
公开(公告)号: | CN108960293B | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 张震;吕传成 | 申请(专利权)人: | 玩咖欢聚文化传媒(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 张绍磊 |
地址: | 100101 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 fm 算法 ctr 预估 方法 系统 | ||
1.一种基于FM算法的CTR预估方法,其特征在于,包括:
在Spark集群对ml包实现FM模型扩展,并对FM模型做降维优化,得到准线性模型;
选取待测环境下不同的特征组合,对准线性模型进行模型训练;
对不同特征组合的模型训练结果做A/B Test,选取效果最好的特征组合和训练后的准线性模型作为最佳模型,并在HDFS中做持久化;
调用最佳模型的准线性模型,根据最佳模型的特征组合选取待测环境下的特征,将选取的特征传入调用的准线性模型中计算,得到CTR预估结果;
待测环境的特征包括联网方式、地域、广告位和/或手机品牌。
2.根据权利要求1所述基于FM算法的CTR预估方法,其特征在于,所述FM模型的目标函数如下:
二次项参数ωij组成一个对称阵W,对称阵W分解为W=VTV,V的第j列便是第j维特征的隐向量,每个参数ωij=vi,vj,因此FM模型可以转化为:
其中ω0∈R,V∈Rn×k,R为实数,Rn×k为n×k的矩阵,n为样本特征数量,k为隐向量长度,i、j为变量,xi为第i个特征的值,vi为xi的隐向量,ω0和ωi为FM模型的参数。
3.根据权利要求2所述基于FM算法的CTR预估方法,其特征在于,所述准线性模型如下:
4.一种基于FM算法的CTR预估系统,其特征在于,包括:
构建单元:用于在Spark集群对ml包实现FM模型扩展,并对FM模型做降维优化,得到准线性模型;
训练单元:用于选取待测环境下不同的特征组合,对准线性模型进行模型训练;
对比单元:对不同特征组合的模型训练结果做A/B Test,选取效果最好的特征组合和训练后的准线性模型作为最佳模型,并在HDFS中做持久化;
预估单元:用于调用最佳模型的准线性模型,根据最佳模型的特征组合选取待测环境下的特征,将选取的特征传入调用的准线性模型中计算,得到CTR预估结果;
待测环境的特征包括联网方式、地域、广告位和/或手机品牌。
5.根据权利要求4所述基于FM算法的CTR预估系统,其特征在于,所述FM模型的目标函数如下:
二次项参数ωij组成一个对称阵W,对称阵W分解为W=VTV,V的第j列便是第j维特征的隐向量,每个参数ωij=vi,vj,因此FM模型可以转化为:
其中ω0∈R,V∈Rn×k,R为实数,Rn×k为n×k的矩阵,n为样本特征数量,k为隐向量长度,i、j为变量,xi为第i个特征的值,vi为xi的隐向量,ω0和ωi为FM模型的参数。
6.根据权利要求5所述基于FM算法的CTR预估系统,其特征在于,所述准线性模型如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于玩咖欢聚文化传媒(北京)有限公司,未经玩咖欢聚文化传媒(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810599540.4/1.html,转载请声明来源钻瓜专利网。