[发明专利]一种基于模型集群的工业大数据自主挖掘方法有效
申请号: | 202111168737.0 | 申请日: | 2021-09-30 |
公开(公告)号: | CN113868311B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 胡绍林;郭其亮;张清华;谢国;文成林;陈文卓;雷高伟 | 申请(专利权)人: | 广东石油化工学院 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06N5/02;G06F17/18 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 李娜 |
地址: | 525000 广东省茂*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 集群 工业 数据 自主 挖掘 方法 | ||
1.一种基于模型集群的工业大数据自主挖掘方法,其特征在于,包括以下步骤:
S1、基于领域知识,采用数据结构分析和特征分析构建模型集群;基于多源异构数据的结构特征,采用时序数据模态分解构建挖掘引擎;
S2、对所述多源异构数据进行采样,并对采样数据的随机误差方差进行容错估计,所述采样数据为工程数据仓库中自动提取的时序数据序列;
S3、利用挖掘引擎对数据集进行挖掘,从工程数据仓库中自动提取时序数据序列,采用多模态加性假定,将时序数据变化过程看成是主体变化分量、随机扰动分量和异常变化分量三种模态的叠加;采用主体分量曲线容错拟合方法,消除野值异常变化分量的影响,实现采样数据中随机扰动分量误差方差的容错估计;采用ψ-函数代入至所述挖掘引擎确定每个采样数据序列的最优容错模型和模型参数的最优容错估计;
S4、利用所述最优容错模型进行拟合优度统计量计算与VVA检验;
S5、模型按结构进行聚类,得到模型的聚类,基于所述模型的聚类对数据按模型进行聚类,得到数据模型表示与内涵知识。
2.根据权利要求1所述的基于模型集群的工业大数据自主挖掘方法,其特征在于,所述模型集群包括:时间序列分析模型类、回归分析模型类、时变曲线拟合模型类和带故障数据类间歇过程模型。
3.根据权利要求2所述的基于模型集群的工业大数据自主挖掘方法,其特征在于,所述挖掘引擎采用容错型挖掘引擎。
4.根据权利要求3所述的基于模型集群的工业大数据自主挖掘方法,其特征在于,所述容错型挖掘引擎的构建方法为:
选取四种模型类中的其中一种和数据集群中的数据集合,构建最小二乘挖掘引擎;
将重衰减型的积分函数代替最小二乘挖掘引擎中的最小二乘积分函数作为损失函数,得到容错型挖掘引擎。
5.根据权利要求1所述的基于模型集群的工业大数据自主挖掘方法,其特征在于,所述VVA检验包括:将挖掘出的最优容错模型进行校核,确认挖掘过程所采用模型集群的合理性;然后考察所述最优容错模型的表达知识与数据之间的一致性,结合对所关联数据集的拟合优度进行检验;最后,对挖掘模型进行知识确认的过程,通过模型确认,实现对挖掘模型和知识的认定。
6.根据权利要求2所述的基于模型集群的工业大数据自主挖掘方法,其特征在于,所述时间序列分析模型类包括:自回归模型、滑动平均模型、自回归滑动平均模型、带周期自回归滑动平均模型、受控自回归模型。
7.根据权利要求2所述的基于模型集群的工业大数据自主挖掘方法,其特征在于,所述回归分析模型类包括:线性回归模型、非线性回归模型和Logistic模型。
8.根据权利要求2所述的基于模型集群的工业大数据自主挖掘方法,其特征在于,所述时变曲线拟合模型类包括:多项式拟合模型、三角多项式拟合模型、周期递进模型。
9.根据权利要求1所述的基于模型集群的工业大数据自主挖掘方法,其特征在于,所述S2包括:
在所述多源异构数据中自动提取时序数据序列;
采用多模态加性假定,将时序数据变化过程看成是主体变化分量、随机扰动分量和异常变化分量三种模态的叠加;
采用主体分量曲线容错拟合方法,消除异常变化分量的影响,得到采样数据中随机扰动分量误差方差的容错估计。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东石油化工学院,未经广东石油化工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111168737.0/1.html,转载请声明来源钻瓜专利网。