[发明专利]一种交互式的迭代建模系统及方法在审
申请号: | 201911185505.9 | 申请日: | 2019-11-27 |
公开(公告)号: | CN110956277A | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 柴磊;许靖;李永辉 | 申请(专利权)人: | 深圳市魔数智擎人工智能有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62;G06F16/25 |
代理公司: | 深圳市神州联合知识产权代理事务所(普通合伙) 44324 | 代理人: | 周松强 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 交互式 建模 系统 方法 | ||
1.一种交互式的迭代建模方法,其特征在于,该方法包括以下步骤:
步骤1:导入数据,获得用于建模的基础数据;
步骤2:数据预处理,对基础数据进行建模前的预处理,使其适直接用于训练模型;
步骤3:选择模型参数,对建模的模型训练参数进行选择和配置,并判断是否进行自动化配置,若进行自动化配置,则进入步骤4;若不进行自动化配置,则进入步骤5;
步骤4:自动化配置,即设置自动化建模参数,利用自动化模型训练系统自动训练多个用于迭代的参考模型;
步骤5:训练模型,根据给定的模型参数进行模型训练,若训练的模型符合要求,则进入步骤7;若训练的模型不符合要求,则进入步骤6;
步骤6:迭代建模,参考自动化配置中生成的参考模型,对比后回到步骤3;
步骤7:结束建模。
2.如权利要求1所述的一种交互式的迭代建模方法,其特征在于,该方法中步骤5和步骤6之间包括步骤51:展示模型报告,展示生成的模型的各项性能指标。
3.如权利要求1所述的一种交互式的迭代建模方法,其特征在于,所述步骤1中导入数据方法包括文件导入、数据库导入和分布式储存系统导入。
4.如权利要求1所述的一种交互式的迭代建模方法,其特征在于,所述步骤2中的数据预处理包括数据清理、数据变换和数据压缩。
5.如权利要求1所述的一种交互式的迭代建模方法,其特征在于,所述步骤3中的参数选择具体包括:
从基础数据中确定模型参数的输入变量和目标变量;
选择建模所需算法;
根据建模算法,配置不同模型参数,所述模型参数包括学习率、子样本比率、迭代轮数和树模型的每棵树最大节点数。
6.如权利要求1所述的一种交互式的迭代建模方法,其特征在于,所述步骤4中自动化配置包括:
特征筛选:利用剃刀、单变量删除、单变量预测、重要特征筛选和单变量递减中的一个或多个方式对基础数据进行筛选;
数据交互:利用无交互变量集、交互变量集、单变量无交互、递增中的一个或多个方式对基础数据的交互策略进行确定;
样本筛选:利用目标固定、等比压缩、异常样本、规则过滤和跨期验证中的一个或多个方式对基础数据中的样本进行筛选;
稳定性检测:目标洗牌、置换、分割和重新抽样中的一个或多个方式对参考模型的稳定性进行检测。
7.一种交互式的迭代建模系统,其特征在于,该系统包括:
源数据适配模块:用于适配不同数据来源实现数据导入;
数据集管理模块:用于对导入的数据进行预处理;
参数管理模块:用于对建模系统进行建模参数配置;
模型管理模块:用于根据参数管理模块配置的建模参数进行建模;
自动化管理模块:用于自动生成参考模型,与模型管理模块生成的模型对比后作为迭代模型用于参数管理模块进行参数设置。
8.如权利要求7所述的一种交互式的迭代建模系统,其特征在于,所述自动化管理模块包括特征筛选单元、交互作用单元、样本筛选单元、稳定性检测单元和特征生成单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市魔数智擎人工智能有限公司,未经深圳市魔数智擎人工智能有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911185505.9/1.html,转载请声明来源钻瓜专利网。