[发明专利]分布式CTR预测模型训练的方法和系统有效
申请号: | 201310741493.X | 申请日: | 2013-12-27 |
公开(公告)号: | CN103745225A | 公开(公告)日: | 2014-04-23 |
发明(设计)人: | 崔晶晶;林佳婕;刘立娜;李春华;马占国 | 申请(专利权)人: | 北京集奥聚合网络技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 100028 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及大数据机器学习领域,公开了一种分布式CTR预测模型训练方法和系统,在分布式并行框架下进行逻辑回归计算,将参数和数据分配到多个一级集群中进行处理;将一级集群进一步细分为多个二级集群,每个一级集群内部的二级集群采用MapReduce架构,Map计算梯度,Reduce计算迭代方向和步长;在二级集群内部采用任务备份机制。通过本发明的方法和系统,能够提高逻辑回归计算中可以处理的样本数和特征参数,同时提高系统的整体运行效率,缩短计算和处理时间,还能有效防止节点出现大的故障而使整个计算中断的情况发生。 | ||
搜索关键词: | 分布式 ctr 预测 模型 训练 方法 系统 | ||
【主权项】:
一种分布式CTR预测模型训练方法,其特征在于,所述方法包括步骤:(1)将全部参数数据集合分块,形成多个训练样本块;(2)每个一级集群执行一个回归模型的副本,处理全部参数数据集合的一个训练样本块;(3)每个一级集群处理完一个训练样本块后,将训练完的参数数据传到参数服务器上进行更新;(4)参数服务器对参数数据进行统一更新,然后再将更新后的参数数据分别下发到每个一级集群。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京集奥聚合网络技术有限公司,未经北京集奥聚合网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310741493.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种多色超薄三明治网布
- 下一篇:一种多功能枕头