[发明专利]基于预测业务场景的自动机器学习方法和设备有效

专利信息
申请号: 201811618614.0 申请日: 2018-12-28
公开(公告)号: CN111444170B 公开(公告)日: 2023-10-03
发明(设计)人: 王敏;秦川;周振华;李瀚;刘勇 申请(专利权)人: 第四范式(北京)技术有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/28;G06N20/00
代理公司: 北京铭硕知识产权代理有限公司 11286 代理人: 董钢;韩明星
地址: 100085 北京市海淀区上*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 预测 业务 场景 自动 机器 学习方法 设备
【说明书】:

本公开提供了一种基于预测业务场景的自动机器学习方法和设备。所述自动机器学习方法可包括:提取与预测业务场景对应的数据范式;基于提取的数据范式提供数据导入引导;接收根据所述数据导入引导而导入的数据项;以及根据导入的数据项进行自动模型训练,其中,所述数据范式至少包括:与所述预测业务场景对应的数据表类别。根据本公开,可为用户提供数据导入引导,使用户更容易使用自动机器学习产品或方法,降低了使用门槛。

技术领域

本公开总体说来涉及机器学习技术,更具体地讲,涉及一种基于预测业务场景的自动机器学习方法和设备。

背景技术

现有的基于机器学习的建模方法涉及如下操作:获取历史数据记录,进行数据处理和特征处理之后得到训练样本,根据特定建模算法,利用所述训练样本来进行模型训练。

为了获得预测特定信息的特定模型,需要建模科学家或专业的建模人员根据建模经验和对业务场景理解,确定每个业务场景中的适合于建立所述特定模型的数据,以进行建模。由于依赖于建模经验和对业务场景的理解,因此实施建模具有较高的门槛,不了解建模方法或业务场景的人员均难以完成建模任务。

自动机器学习(简称为AutoML)方法,可基于输入的数据自动进行模型训练。但为此,需要导入固定格式的数据,即:需要用户根据固定格式进行数据准备,很多时候需要将用户已有的数据转化为需要的数据格式,才能使用转化的数据进行模型训练,导致操作繁琐,甚至有时,用户根本无法自己完成数据准备工作。

发明内容

本公开的示例性实施例旨在克服现有自动机器学习技术中存在数据准备不便的缺陷。

根据本公开的示例性实施例,提供了一种基于预测业务场景的自动机器学习方法。所述自动机器学习方法可包括:提取与预测业务场景对应的数据范式;基于提取的数据范式提供数据导入引导;接收根据所述数据导入引导而导入的数据项;以及根据导入的数据项进行自动模型训练,其中,所述数据范式至少包括:与所述预测业务场景对应的数据表类别。

可选的,与所述数据表类别对应的数据表包括以下项中的至少一项:至少两个主体数据表;至少两个主体数据表以及至少一个关于所述至少两个主体数据表之间的相互关系的关系数据表;至少一个主体数据表以及与所述至少一个主体数据表对应的业务表。

可选的,所述数据导入引导包括以下项之中的至少一项:用于引导用户分别导入与每个数据表类别对应的数据表的交互控件、用于引导用户在导入的数据表中指定待预测项或基于导入的数据表来构建待预测项的交互控件、用于引导用户指定导入的数据表的主键的交互控件、用于引导用户指定导入的数据表的时间类型的交互控件、用于引导用户指定导入的数据表的字段类型的交互控件、用于引导用户建立导入的数据表之间的关联关系的交互控件、用于引导用户建立与导入的数据表相关的业务场景的场景配置表。

可选的,接收根据所述数据导入引导而导入的数据项包括:接收根据所述数据导入引导而导入的数据表、待预测项、数据表的主键、数据表的时间类型、数据表的字段类型、数据表之间的关联关系、场景配置表之中的至少一项。

可选的,根据导入的数据项进行自动模型训练包括:基于导入的数据项将数据表拼接成数据拼接表,并进行特征抽取以得到训练样本表;以及利用训练样本表中的训练样本自动进行机器学习,以得到机器学习模型。

可选的,所述预测业务场景涉及营销场景、反欺诈场景和/或推荐场景。

可选的,所述预测业务场景涉及营销场景,并且,所述数据表类别至少包括:用户表、产品表、行为表。

可选的,数据表的时间类型包括:流水表、静态表、拉链表和切片表之中的至少一个。

根据本公开的另一示例性实施例,提供了一种包括至少一个计算装置和至少一个存储指令的存储装置的系统,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的自动机器学习方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811618614.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top