[发明专利]高阶LR模型的训练优化方法、装置、设备及存储介质在审
申请号: | 201910932620.1 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110688623A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 肖淋峰;吴志坚 | 申请(专利权)人: | 深圳乐信软件技术有限公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06F16/2458;G06F16/27 |
代理公司: | 11332 北京品源专利代理有限公司 | 代理人: | 孟金喆 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 高阶 基础配置文件 处理设备 管理设备 目标训练 训练模型 初始训练数据 分布式模型 存储介质 方法使用 模型训练 数据对应 算法 分发 优化 | ||
1.一种高阶LR模型的训练优化方法,其特征在于,所述方法使用分布式的方式实现,包括:
管理设备根据初始训练数据,生成高阶LR基础配置文件;
所述管理设备向至少两个处理设备分发所述高阶LR基础配置文件以及对应的目标训练数据,以使各所述处理设备分布式的使用所述高阶LR基础配置文件对所接收到的目标训练数据进行处理,得到与所接收到的目标训练数据对应的交叉特征;
所述管理设备获取各所述处理设备处理得到的交叉特征后,将各所述交叉特征分别输入至训练模型中,以对训练模型进行参数调优。
2.根据权利要求1所述的方法,其特征在于,管理设备根据初始训练数据,生成高阶LR基础配置文件,包括:
所述管理设备确定初始训练数据中待离散的特征,并生成对应的离散配置信息填入所述高阶LR基础配置文件;
所述管理设备确定初始训练数据中待高阶交叉的特征,并生成对应的交叉配置信息填入所述高阶LR基础配置文件;
所述管理设备确定分配给各处理设备的目标训练数据,并生成对应的资源分配信息填入所述高阶LR基础配置文件。
3.一种高阶LR模型的训练优化方法,其特征在于,所述方法使用分布式的方式实现,包括:
处理设备接收管理设备分发的高阶LR基础配置文件以及对应的目标训练数据,其中,所述高阶LR基础配置文件为所述管理设备根据初始训练数据生成的;
所述处理设备根据所述高阶LR基础配置文件对接收的目标训练数据进行特征离散处理,得到离散特征;
所述处理设备对所述离散特征进行高阶交叉处理,得到交叉特征后发送至数据库,以使所述管理设备从数据库中获取各所述处理设备发送的交叉特征并输入至训练模型,以对训练模型进行参数调优。
4.根据权利要求3所述的方法,其特征在于,离散配置信息包括待离散的特征以及离散处理规则;
所述处理设备根据高阶LR基础配置文件对接收的目标训练数据进行特征离散处理,得到离散特征,包括:
所述处理设备根据高阶LR基础配置文件中的离散配置信息,从接收的目标训练数据的特征中选出待离散的特征;
所述处理设备根据离散处理规则,对待离散特征对应的训练数据进行离散处理,得到离散特征。
5.根据权利要求4所述的方法,其特征在于,在所述处理设备根据高阶LR基础配置文件对接收的目标训练数据进行特征离散处理,得到离散特征之时,还包括:
所述处理设备根据高阶LR基础配置文件中的交叉配置信息,生成包括高阶交叉规则的高阶交叉配置文件。
6.根据权利要求4所述的方法,其特征在于,所述处理设备对所述离散特征进行高阶交叉处理,得到交叉特征,包括:
所述处理设备根据高阶LR基础配置文件中的交叉配置信息,从接收的目标训练数据的特征中选出待高阶交叉的特征;
所述处理设备根据高阶交叉配置文件中的高阶交叉规则,对待高阶交叉的特征进行交叉处理,得到交叉特征。
7.一种高阶LR模型的训练优化装置,其特征在于,包括:
配置文件生成模块,用于根据初始训练数据,生成高阶LR基础配置文件;
文件及数据发送模块,用于向至少两个处理设备分发所述高阶LR基础配置文件以及对应的目标训练数据,以使各所述处理设备分布式的使用所述高阶LR基础配置文件对所接收到的目标训练数据进行处理,得到与所接收到的目标训练数据对应的交叉特征;
模型训练模块,用于获取各所述处理设备处理得到的交叉特征后,将各所述交叉特征分别输入至训练模型中,以对训练模型进行参数调优。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳乐信软件技术有限公司,未经深圳乐信软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910932620.1/1.html,转载请声明来源钻瓜专利网。