[发明专利]一种通用的大数据模型配置和分析方法在审
申请号: | 202010198405.6 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111339375A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 李明江;万欢;刘敏;辛国安;郑毅;黄小非;刘欢;杜宏伟;闫宾;李新建 | 申请(专利权)人: | 中国海洋石油集团有限公司;中海油能源发展股份有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/904 |
代理公司: | 天津创智天诚知识产权代理事务所(普通合伙) 12214 | 代理人: | 王秀奎 |
地址: | 100010 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通用 数据模型 配置 分析 方法 | ||
1.一种通用的大数据模型配置和分析方法,其特征在于:
(1)构建分析模型配置方法
第一步:确定分析模型名称,从算法库中选择分析算法,配置算法参数;
第二步:从数据集中选择一张或多张元数据表,勾选出要分析的数据列,作为数据分析的数据集,配置数据筛选、分组、排序等数据处理,最后得到的数据作为模型分析的基础数据;
第三步:填写数据清洗规则,对分析基础数据进行重新的审查和校验、处理无效值和缺失值、删除重复信息、对数据列进行计算与处理,并对数据进行筛选、分组、排序;
第四步:选择潜在因素列作为数据样本,除聚类等无监督学习之外,指定一个特征列,选择目标因素;
(2)大数据分析配置与执行方法
第一步:配置训练模型执行模式,有手动执行和调度执行两种模式,手动模式为一次性训练,调度执行模式针对增量数据自动批量训练执行;
第二步:配置完成后,系统后台运行,自动根据选定的海量数据集进行数据准备、清洗,按照选定的算法及配置参数进行训练,分析比较评估指标,选用最优算法参数,最终生成分析模型;
第三步:根据训练结果,对不理想的模型,调整模型参数,反复训练,每次训练执行后,生成训练版本号、批次号及详细分析结果,可供查询;
第四步:对训练好的模型,转换成实际预测模型,指定预测(实时)数据进行预测预警分析;
(3)推送预警信息
预警推送中心,监控各模型执行情况,对于大数据分析的异常分析结果,实时处理推送预警信息,提醒、通知相关人员;
(4)预览分析结果
对模型执行情况,可从定制的界面中查看分析结果可视化数据,也可以查看模型版本号、批次号及详细分析结果;
(5)共享分析模型
提供分析模型的双向共享功能,对于其他系统的优秀分析模型,可以借鉴并引入,然后成化为平台内的分析模型,同时平台中的分析模型可以导出,将分析模型和软件接口规范提供给其它系统使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋石油集团有限公司;中海油能源发展股份有限公司,未经中国海洋石油集团有限公司;中海油能源发展股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010198405.6/1.html,转载请声明来源钻瓜专利网。