[发明专利]高阶LR模型的训练优化方法、装置、设备及存储介质在审

专利信息
申请号: 201910932620.1 申请日: 2019-09-29
公开(公告)号: CN110688623A 公开(公告)日: 2020-01-14
发明(设计)人: 肖淋峰;吴志坚 申请(专利权)人: 深圳乐信软件技术有限公司
主分类号: G06F17/18 分类号: G06F17/18;G06F16/2458;G06F16/27
代理公司: 11332 北京品源专利代理有限公司 代理人: 孟金喆
地址: 518000 广东省深圳市南山区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 高阶 基础配置文件 处理设备 管理设备 目标训练 训练模型 初始训练数据 分布式模型 存储介质 方法使用 模型训练 数据对应 算法 分发 优化
【说明书】:

发明实施例公开了一种高阶LR模型的训练优化方法、装置、设备及存储介质。所述方法使用分布式的方式实现,包括:管理设备根据初始训练数据,生成高阶LR基础配置文件;所述管理设备向至少两个处理设备分发所述高阶LR基础配置文件以及对应的目标训练数据,以使各所述处理设备分布式的使用所述高阶LR基础配置文件对所接收到的目标训练数据进行处理,得到与所接收到的目标训练数据对应的交叉特征;所述管理设备获取各所述处理设备处理得到的交叉特征后,将各所述交叉特征分别输入至训练模型中,以对训练模型进行参数调优。本发明实施例的技术方案,实现了分布式模型训练,节省模型训练的时间,提升算法的性能。

技术领域

本发明实施例涉及计算机技术领域,尤其涉及一种高阶LR模型的训练优化方法、装置、设备及存储介质。

背景技术

随着电商的普及,数据量迅速增加,人们对数据进行准确筛选的难度越来越大,因此,可以从大量数据中筛选并推荐所需数据的推荐系统受到人们的欢迎,在电商中已经是一种必备的重要系统。

目前,高阶逻辑回归(Logistic Regression,LR)算法是推荐系统进行模型训练的流行算法,现有的根据高阶LR算法进行模型训练的过程比较复杂,并且所有的步骤都是单机串行完成,还需要人工在windows端生成高阶过程的配置文件。由于高阶LR算法的配置文件中涉及的参数众多,不同场景不同的数据,最优模型需求的配置都不相同,因此,在人工手动输入时极易出错,再加上测试时间比较长,查错通常需要好几个小时,因此,工作人员不得不花更多的时间去修改缺陷和问题,调整参数。

发明内容

本发明实施例提供一种高阶LR模型的训练优化方法、装置、设备及存储介质,以实现分布式模型训练,节省模型训练的时间,提升算法的性能。

第一方面,本发明实施例提供了一种高阶LR模型的训练优化方法,所述方法使用分布式的方式实现,包括:

管理设备根据初始训练数据,生成高阶LR基础配置文件;

所述管理设备向至少两个处理设备分发所述高阶LR基础配置文件以及对应的目标训练数据,以使各所述处理设备分布式的使用所述高阶LR基础配置文件对所接收到的目标训练数据进行处理,得到与所接收到的目标训练数据对应的交叉特征;

所述管理设备获取各所述处理设备处理得到的交叉特征后,将各所述交叉特征分别输入至训练模型中,以对训练模型进行参数调优。

可选的,管理设备根据初始训练数据,生成高阶LR基础配置文件,包括:

所述管理设备确定初始训练数据中待离散的特征,并生成对应的离散配置信息填入所述高阶LR基础配置文件;

所述管理设备确定初始训练数据中待高阶交叉的特征,并生成对应的交叉配置信息填入所述高阶LR基础配置文件;

所述管理设备确定分配给各处理设备的目标训练数据,并生成对应的资源分配信息填入所述高阶LR基础配置文件。

第二方面,本发明实施例还提供了一种高阶LR模型的训练优化方法,所述方法使用分布式的方式实现,包括:

处理设备接收管理设备分发的高阶LR基础配置文件以及对应的目标训练数据,其中,所述高阶LR基础配置文件为所述管理设备根据初始训练数据生成的;

所述处理设备根据所述高阶LR基础配置文件对接收的目标训练数据进行特征离散处理,得到离散特征;

所述处理设备对所述离散特征进行高阶交叉处理,得到交叉特征后发送至数据库,以使所述管理设备从数据库中获取各所述处理设备发送的交叉特征并输入至训练模型,以对训练模型进行参数调优。

可选的,离散配置信息包括待离散的特征以及离散处理规则;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳乐信软件技术有限公司,未经深圳乐信软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910932620.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top