[发明专利]一种流程对象原始数据时序发现与调整方法有效
申请号: | 201410542448.6 | 申请日: | 2014-10-14 |
公开(公告)号: | CN104346169B | 公开(公告)日: | 2017-06-16 |
发明(设计)人: | 郭庆北;朱连江;曲守宁;杜韬;张坤;程新功;王钦;张勇;王凯 | 申请(专利权)人: | 济南大学 |
主分类号: | G06F9/44 | 分类号: | G06F9/44 |
代理公司: | 济南舜源专利事务所有限公司37205 | 代理人: | 赵佳民 |
地址: | 250022 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 流程 对象 原始数据 时序 发现 调整 方法 | ||
技术领域
本发明涉及流程工业生产领域,尤其涉及流程工业中的一种流程对象原始数据时序发现与调整方法。
背景技术
在流程工业生产中,生产过程根据工业要求由一个个环节构成的,各个环节具有传递性,每个环节通常需要加装许多检测装置,通过数据接口,将检测数据传入数据存储计算机中,数据量巨大,利用这些数据进行优化工业控制流程、辅助控制决策的需求不断增加;而且流程工业的数据采集是基于一定频率的,各个环节采集到的数据是相互联系的,并且是相互制约的,流程工业中的各个环节具有时序特征,但是由于状态传播的延迟,使采集到的数据不具有时序性,相同时刻的各环节数据不是该时刻对其他环节产生响应的数据,表现出了不同步的特性,直接用该数据进行后续运算不会反映出流程数据的时序性;时序运算,即找出流程对象各测点之间的时序,并求出时序流程不同测点之间的延迟时间,一直是研究热题;然而由于在流程工业生产过程中,常常因其煅烧过程和物料的复杂性,还存在着一些复杂而且目前还不可检测的环境因素,工作环境的限制与信息采集技术的不完善,导致获得的原始数据间时序特征不明显且存在大量的噪声与错漏数据,导致从原始数据中获取知识非常困难,因此迫切需要对原始数据进行规范化处理。
流程对象通常具有以下特性:1、多环节性,一个流程对象,通常由诸多环节构成,每个环节根据工艺要求前后相连,前一环节的输出是它下一环节的输入;2、单向向前相关性,我们可以将一个流程看作一个开环系统(通常在工业过程中,局部的闭环控制可以视为一个环节),对于一个开环系统,每个环节的输出是他后一个环节的输入,其单项相关性是显而易见的;3、时序性,由于流程对象中,各环节在得到前一环节的输出时,本环节的变化需要一定的时间,前一环节的状态变化将经过一段时间后才能导致下一状态的变化。那么,流程对象各环节的状态参数实际上是一个时间序列。
现有的数据处理技术大多采用随机抽样和人工干预的方式对原始数据进行预处理,受人为因素影响较多,且无法对数据间的时间序列进行调整,所以难以真正体现流程对象间的影响关系。因此需要一种面向流程对象的原始数据的时序发现与调整方法,提升知识发现能力。
发明内容
为了克服现有技术中存在的不足,本发明提供一种流程对象原始数据时序发现与调整方法,对原始数据进行抽样、发现时序并调整时序,具有简单、精确、人为干预少的优点,以解决现有流程工业中原始数据错漏较多,无法体现各个环节间的相互影响关系的问题。
为实现上述目的,本发明对流程对象进行了定义:流程对象是多个环节、具有向前相关性的时间序列集合,这个时间序列集合中的数据来自各个环节的可采样测点,在流程对象x中,某一测点Xi的变化导致另一测点Xj产生响应的时间差值为测点Xi对测点Xj的延迟时间为时间距,记为Δtij,Δtij=t(Xj)-t(Xi)。本发明根据流程对象的特点提出了利用测点中数据的分布规律进行统计分类的方法实现数据抽样与时序发现的方案,并根据时序计算结果调整数据,使之符合周期规律,便于智能处理。
具体的,本发明采取如下技术方案:
一种流程对象原始数据时序发现与调整方法,包括如下步骤:
数据取样步骤,对流程对象各环节测点在时间T内采集到的原始数据集进行抽样,抽取单位时间段内变化量最大的数据片段作为样本数据;
时序发现步骤,以任意环节测点为基测点,计算其与其他环节测点间的延迟时间,从而获得包含所有环节测点时间顺序的时间序列L;
时序调整步骤,根据时间序列L对各环节测点原始数据进行时序调整。
更进一步的,由于原始数据记录数巨大,逐条记录遍历来统计连续记录数效率低下,耗费系统时间长,不符合大数据处理的要求,本发明采用了逐步缩小时间范围的算法来快速求得记录的最长连续时间段。另外,本发明选择流程对象中变化量最大的数据片段作为数据样本。数据的差分代表了数据的状态变化,而差分大小代表了数据变化的幅度,变化即是信息,变化幅度越大包含的信息越多,数据变化量即是环节数据差分绝对值的和,因此选择数据变化量最大的数据片段也即选择了包含信息量最大的数据片段。
因此,本发明数据取样步骤采用基于差分的数据取样方法进行抽样,将时间T划分为若干时间段,计算每个时间段内各个环节测点数据变化量,抽取各个环节测点数据变化量之和最大的时间段内采集的数据片段作为样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学,未经济南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410542448.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:带有复合面料层的复合网层导电和抗菌面料
- 下一篇:一种防水无纺布