[发明专利]基于FM算法的CTR预估方法及系统有效
申请号: | 201810599540.4 | 申请日: | 2018-06-12 |
公开(公告)号: | CN108960293B | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 张震;吕传成 | 申请(专利权)人: | 玩咖欢聚文化传媒(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 张绍磊 |
地址: | 100101 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供的基于FM算法的CTR预估方法及系统,该方法在Spark集群对ml包实现FM模型扩展,并对FM模型做降维优化,得到准线性模型;选取待测环境下不同的特征组合,对准线性模型进行模型训练;对不同特征组合的模型训练结果做A/B Test,选取效果最好的特征组合和训练后的准线性模型作为最佳模型,并在HDFS中做持久化;调用最佳模型的准线性模型,根据最佳模型的特征组合选取待测环境下的特征,将选取的特征传入调用的准线性模型中计算,得到CTR预估结果。通过FM模型能自动学习高阶属性的权值,不用通过人工的方式选取特征来做交叉,考虑特征之间的关系,增强了模型的泛化能力,并且适合处理稀疏数据,能够用于对时间要求较高的计算广告方向的CTR预估。 | ||
搜索关键词: | 基于 fm 算法 ctr 预估 方法 系统 | ||
【主权项】:
1.一种基于FM算法的CTR预估方法,其特征在于,包括:在Spark集群对ml包实现FM模型扩展,并对FM模型做降维优化,得到准线性模型;选取待测环境下不同的特征组合,对准线性模型进行模型训练;对不同特征组合的模型训练结果做A/B Test,选取效果最好的特征组合和训练后的准线性模型作为最佳模型,并在HDFS中做持久化;调用最佳模型的准线性模型,根据最佳模型的特征组合选取待测环境下的特征,将选取的特征传入调用的准线性模型中计算,得到CTR预估结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于玩咖欢聚文化传媒(北京)有限公司,未经玩咖欢聚文化传媒(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810599540.4/,转载请声明来源钻瓜专利网。