[发明专利]一种基于工业过程的大数据压缩方法有效

专利信息
申请号: 201610785231.7 申请日: 2016-08-31
公开(公告)号: CN106372181B 公开(公告)日: 2019-08-06
发明(设计)人: 徐泉;刘文庆;张鹏;冉振莉;王良勇;吴志伟;许美蓉;崔东亮 申请(专利权)人: 东北大学
主分类号: G06F16/174 分类号: G06F16/174
代理公司: 沈阳东大知识产权代理有限公司 21109 代理人: 梁焱
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于工业过程的大数据压缩方法,涉及工业大数据分析技术领域。本发明通过对采集的生产数据按数据块和采集数据项进行压缩,根据采集数据项的类别,对浮点型、布尔型和字符型的采集数据分别进行处理,判定浮点型数值波动范围和比较布尔型、字符型相邻数据的变化来决定需要压缩的保存的数据。本发明既能有效改善工业过程中因时间的增加后采集数据项的数值发生偏移导致压缩结果偏差过大的问题,又能减少压缩后的采集数据项所占空间的大小,提高压缩效率,使工业数据库系统快速、有效地管理数据。
搜索关键词: 一种 基于 工业 过程 数据压缩 方法
【主权项】:
1.一种基于工业过程的大数据压缩方法,其特征在于,包括下述步骤:步骤1、定义工业过程采集数据的数据标识项,对采集的工业过程生产数据按采集数据项进行编号,作为数据标识项;步骤2、对采集数据项进行数据压缩处理,压缩过程如下:步骤2.1、设定压缩数据块的大小,将采集的数据分为若干个数据块;步骤2.2、对步骤2.1中数据块进行编号,形成数据组<编号,数据块内容>;步骤2.3、将步骤2.2中待压缩数据块中的采样数据项的采样时刻与该数据块中采样数据项初始采样时刻的偏差作为时间偏移量,即该时间偏移量为采样周期的整数倍,对读取的数据块中的采样数据项按采集数据项的编号依次进行压缩,具体步骤为:步骤2.3.1、对该数据块中的待压缩的采集数据项的数据进行压缩,判断该采集数据项的数据类型,若是数值型生产数据,则执行步骤2.3.2,对数值型生产数据进行压缩处理,若是布尔型生产数据,则执行步骤2.3.3,对布尔型生产数据进行压缩处理,若是字符型生产数据,执行步骤2.3.4,对字符型生产数据进行压缩;步骤2.3.2、对数值型生产数据进行压缩处理,具体方法如下:步骤2.3.2.1、设定该数值型生产数据的数值波动范围;步骤2.3.2.2、根据数据块中的该数值型采集数据项第m1(m1≥1)个采样时刻的数值,判断该采集数据项第m1+1个采样时刻的数值是否超出所设定的波动范围,若是,则执行步骤2.3.2.3;若否,则执行步骤2.3.2.4;步骤2.3.2.3、记录对应采样时刻的时间偏移量和该采样时刻的数值写入数值型采集数据项对应的T,V二元组形式的压缩数据对{T[],V[]}中,为执行步骤2.3.2.4;步骤2.3.2.4、判断m1是否等于n1,n1表示该数值型采集数据项的所有采样时刻的个数,若不等于,则m1加1,返回步骤2.3.2.2;若等于,则判断压缩数据对{T[],V[]}中是否为空,若为空,则将最后一个采样时刻的时间偏移量和对应的数值写入压缩数据对{T[],V[]}中,为再执行步骤2.3.5,若不为空,则执行步骤2.3.5;步骤2.3.3、对布尔型生产数据进行压缩处理,具体方法如下:步骤2.3.3.1、根据数据块中的该布尔型采集数据项第m2(m2≥1)个采样时刻的数值,判断该采集数据项第m2+1个采样时刻的数值是否发生改变,若是,则执行步骤2.3.3.2;若否,则执行步骤2.3.3.3;步骤2.3.3.2、记录对应采样时刻的时间偏移量和该采样时刻对应的数值写入该布尔型采集数据项对应的T,V二元组形式的压缩数据对{T[],V[]}中,为执行步骤2.3.3.3;步骤2.3.3.3、判断m2是否等于n2,n2表示该布尔型采集数据项的所有采样时刻的个数,若不等于,则将m2加1,返回步骤2.3.3.1;若等于,则判断压缩数据对{T[],V[]}中是否为空,若为空,则将最后一个采样时刻的时间偏移量和对应的数值写入压缩数据对{T[],V[]}中,为再执行步骤2.3.5;步骤2.3.4、对字符型生产数据进行压缩处理,工业过程中字符型数据只有若干个取值,首先对该字符型数据能取得的状态进行编码,然后对该采集数据项进行压缩,具体方法如下:步骤2.3.4.1、根据数据块中的该字符型采集数据项第m3(m3≥1)个采样时刻的数值,判断该采集数据项第m3+1个采样时刻的数值是否发生改变,若是,则执行步骤2.3.4.2;若否,则执行步骤2.3.4.3;步骤2.3.4.2、记录对应采样时刻的时间偏移量和该采样时刻对应的数值写入该字符型采集数据项对应的T,V二元组形式的压缩数据对{T[],V[]}中,为执行步骤2.3.4.3;步骤2.3.4.3、判断m3是否等于n3,n3表示该字符型采集数据项的所有采样时刻的个数,若不等于,则将m3加1,返回步骤2.3.4.1;若等于,则判断压缩数据对{T[],V[]}中是否为空,若为空,则将最后一个采样时刻的时间偏移量和对应的数值写入压缩数据对{T[],V[]}中,为再执行步骤2.3.5;步骤2.3.5、判断是否该数据块的所有数据采集项完成压缩,若是,则执行步骤3;若否,则采集数据项编号后移一位,对该数据块的下一个采集数据项的数据进行压缩,执行步骤2.3.1;步骤3、判断是否步骤2.2中所有数据块都完成压缩,若是,则步骤结束,若否,则返回执行步骤2.3,对下一个新的数据块进行压缩。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610785231.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top