[发明专利]基于MIV与关联规则的优化方法及石化设备的数据建模方法有效
申请号: | 201810201692.4 | 申请日: | 2018-03-12 |
公开(公告)号: | CN108446358B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 鄢烈祥;高丽君;史彬 | 申请(专利权)人: | 武汉理工大学 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/2458;G06F16/28;G06K9/62;G06Q50/06 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 邬丽明 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 miv 关联 规则 优化 方法 石化 设备 数据 建模 | ||
本发明公开了一种基于MIV与关联规则的优化方法及石化设备的数据建模方法,优化方法包括如下步骤:Ⅰ)约简变量:应用MIV方法对连续变量空间的大数据进行分析、计算求得各个变量的MIV值,筛选出对优化目标影响大的主要变量,得到约简的数据集;Ⅱ)离散化数据:应用K‑means的分类算法将步骤Ⅰ)得到的连续变量的值域离散化,将连续变量空间转换为整数变量空间;Ⅲ)用挖掘频繁项集的Apriori算法对步骤Ⅱ)得到的整数变量进行计算,得出所需的关联规则;Ⅳ)对步骤Ⅲ)计算出的关联规则进行分析,确定出优化点或优化区域。本发明基于MIV与关联规则的优化方法,可以对石化设备的大数据进行降维处理,并进一步挖掘其中的关联规则,从而确定优化方案,建立数据模型。
技术领域
本发明属于技术领域,特别涉及一种基于MIV与关联规则的优化方法及石化设备的数据建模方法。
背景技术
面对石化设备中稳定增长的数据建模需求,数据挖掘技术有不可估量的实际项目运用价值,这对于炼化企业减少操作费用提升油品收益的作用将十分显著。但是在石化领域应用数据挖掘技术要比其他领域困难,这可归结于石化设备的数据的特点:生产过程的进行需要时间,造成测量出来的质量数据和操作参数会有时间上的滞后;数据测量的频率非常高,导致数据量很大,而且记录的数据类别繁多使得数据的维数很大;数据每时每刻都是随着生产状况而改变的,随时间起伏不定;最后,由于生产情况复杂,各种开停车,生产波动使得数据会存在离群点。这还只是数据上存在的困难,此外,要想对石化设备建模,必须还要对流程有一定深度的了解。由于基于数据驱动的模型能很好地适应复杂生产流程,同时又能在不进行大规模改造的前提下提高企业效益,使得应用于石化设备的数据挖掘技术在近期已经越发上升为一个具有理论探索和工程实用性的热点方向。
发明内容
本发明针对现有技术中存在的技术问题,提供一种基于MIV与关联规则的优化方法及石化设备的数据建模方法,可对石化设备中的大数据进行建模优化,提高企业效益。
为解决上述技术问题,本发明采用的技术方案是:
一种基于MIV与关联规则的优化方法,包括如下步骤:
Ⅰ)约简变量:应用MIV方法对连续变量空间的大数据进行分析、计算,求得各个变量的MIV值,筛选出对优化目标影响大的主要变量,删除无关或影响不大的变量,得到约简的数据集;
Ⅱ)离散化数据:应用K-means的分类算法将步骤Ⅰ)得到的连续变量的值域离散化,将连续变量空间转换为整数变量空间;
Ⅲ)用挖掘频繁项集的Apriori算法对步骤Ⅱ)得到的整数变量进行计算,得出所需的关联规则;
Ⅳ)对步骤Ⅲ)计算出的关联规则进行分析,确定出优化点或优化区域。
作为优选,得到约简的数据集的计算步骤如下:
1)使用样本数据X建立一个准确的BP神经网络模型;
2)在原有输入X的基础上生成单变量增减10%的两组新的输入X1、X2;
3)将X1和X2代入已训练好的神经网络,计算网络的输出值Y1和Y2;
4)计算Y1-Y2的差值,根据样本数取平均值,即求得变量的MIV值;
5)重复上述步骤,依次计算出各个变量的MIV值。
6)对所有变量按MIV的绝对值大小进行排序,筛选出MIV值较大的变量,以实现对操作变量的约简。
作为优选,所述步骤Ⅱ)的计算过程如下:
(1).从步骤Ⅰ)的数据集中随机选择k个样本,作为初始聚类中心;
(2).针对数据集中的每个样本,根据以下公式计算它到k个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学,未经武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810201692.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于二维地理位置的海量数据空间范围查询方法
- 下一篇:信息推荐方法和装置