[发明专利]一种时序键值型工业过程数据的摘要索引生成方法在审
申请号: | 201810270729.9 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108470068A | 公开(公告)日: | 2018-08-31 |
发明(设计)人: | 张可;韩载道;李媛 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 胡柯 |
地址: | 400044 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 工业过程数据 时间序列数据 时序 摘要索引 聚合 预处理 近似 模式聚类 前缀树 数据预处理 方法表示 平滑噪声 算法融合 算法实现 时间戳 原数据 算法 维度 索引 | ||
1.一种时序键值型工业过程数据的摘要索引生成方法,其特征在于,所述方法步骤如下:
S1:获取时序键值型工业过程数据;
S2:对获取的时间序列数据作平滑噪声预处理得到具有时间戳的时间序列数据;
S3:采用符号聚合近似表示方法表示预处理得到时间序列数据;
S4:将符号聚合近似表示后的结果进行模式聚类,将进行模式聚类后的结果采用前缀算法形成索引。
2.如权利要求1所述的时序键值型工业过程数据的摘要索引生成方法,其特征在于,所述步骤S2中的对获取的时间序列数据作平滑噪声预处理的具体步骤如下:
S21:对原始时间序列数据进行偏差检测;发现噪声、离群点和不寻常的值,考察每个属性的定义域和数据类型以及每个属性可接受值的范围;
S22:通过考察数据领域内的值,通过分箱方法中的按照箱平均值法求得平滑数据值来光滑有序数据,将连续数据离散化,获取预处理后的时序数据,增加粒度。
3.如权利要求1所述的时序键值型工业过程数据的摘要索引生成方法,其特征在于,所述步骤S3的具体步骤如下:
S31:对经过步骤S2预处理后得到的时序数据进行等长度分段,取各段的平均值构成新的时序数据用以表示原高维时序数据;
S32:对于降维后所得的时序数据,应用符号聚合近似表示方法表示得到该时序数据的离散化近似表示。
4.如权利要求1所述的时序键值型工业过程数据的摘要索引生成方法,其特征在于,所述步骤S4包括有:
S41:对于步骤S3所得时序数据符号化表示形式,应用K均值模式聚类方法对S3的结果聚类,得到一串离散化的字符串模式结果;
S42:基于上述结果,应用前缀树算法进行编码,形成索引。
5.如权利要求3所述的时序键值型工业过程数据的摘要索引生成方法,其特征在于,所述步骤S31包括有:
步骤S2得到的时序数据维数为n,处理后所得维数为N;第i子段均值可由下述公式确定:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810270729.9/1.html,转载请声明来源钻瓜专利网。