[发明专利]一种批生产的时序数据特征提取方法在审
申请号: | 202010997808.7 | 申请日: | 2020-09-21 |
公开(公告)号: | CN112256679A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 瞿海斌;谢欣媛;张胜 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06F16/26;G06K9/62 |
代理公司: | 杭州橙知果专利代理事务所(特殊普通合伙) 33261 | 代理人: | 李品 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生产 时序 数据 特征 提取 方法 | ||
本发明属于数据挖掘技术领域,尤其是涉及一种批生产的时序数据特征提取方法。一种批生产的时序数据特征提取方法,包括以下步骤:S1、数据获取,从数据源获取目标批次的过程数据X;S2、数据清洗,遍历各个变量并定位质量差的数据点,将定位到的质量差数据的变量剔除;S3、数据分割,根据目标对象的实际意义和分析需求并利用现有变量;S4、变量筛选,根据目标对象的实际意义和分析需求进行分析变量的筛选;S5、特征指标确定,根据目标对象的实际意义和分析需求确定描述单个变量特征的指标;S6、特征矩阵构建。本发明提供了一种压缩数据量、保留过程特征、可减少后续分析工作的运算压力的批生产的时序数据特征提取方法。
技术领域
本发明属于数据挖掘技术领域,尤其是涉及一种批生产的时序数据特征提取方法。
背景技术
数据挖掘(Data Mining)是指从大量含有噪声的、不完全的、模糊的数据中提取事先未知的又有潜在价值的信息的过程。工业生产数据具有大量(volume)、高速(velocity)、多样性(variety)、真实性(veracity)、可见性(visibility)和价值(value)的特征。大量(volume)即数据的规模大,高速(velocity)即数据的产生和采集非常频繁,多样性(variety)即数据的异构多样,真实性(veracity)即避免数据收集和提炼过程中发生的数据质量污染所导致的“虚假”信息,可见性(visibility)即通过分析使以往不可见的信息可见,价值(value)即分析获得的信息应被转换成价值。工业数据的产生主体是人和机器,即由人工输入的数据和通过相应传感器、仪器仪表、智能终端从设备上采集的数据,其中来自机器的数据在体量上占主要地位。这些数据中含有生产过程的宝贵信息,通过对生产数据进行挖掘,能进一步揭示生产规律,为生产优化提供助力。
当前批生产方式广泛应用于制药、食品、化工等行业。批生产数据存在以下特点:生产过程数据为时序数据,能反映生产过程随时间的变化趋势;每个批次的时间长度通常不相等,故每批次的过程变量样本数不同;生产过程数据采集频率高,变量数多,导致单批次的数据量大。针对某对象进行研究时,往往需要分析多个批次的生产数据,变量多、批次间样本数不等、数据量大,都对分析工作的推进提出了挑战。
发明内容
本发明所要解决的技术问题是提供一种压缩数据量、保留过程特征、可减少后续分析工作的运算压力的批生产的时序数据特征提取方法。为此,本发明采用以下技术方案:
一种批生产的时序数据特征提取方法,包括以下步骤:
S1、数据获取,从数据源获取目标批次的过程数据X:
其中,n为样本数,n≥1;m为变量数,m7;
S2、数据清洗,遍历各个变量并定位质量差的数据点,将定位到的质量差数据的变量剔除;
S3、数据分割,根据目标对象的实际意义和分析需求并利用现有变量,将过程数据分割为k部分,k≥2,每部分的样本数为ni,i=1,2,…,k;
S4、变量筛选,根据目标对象的实际意义和分析需求进行分析变量的筛选,获得:
其中,筛选后变量数为d,1≤d≤n,i=1,2,…k;
S5、特征指标确定,根据目标对象的实际意义和分析需求确定描述单个变量特征的指标,该指标数计为t,1≤t≤7;
S6、特征矩阵构建,基于数据矩阵Ai计算各变量的指标,并整理为行向量Ri,根据行向量Ri构建目标批次的特征矩阵Sk×dt,其中i=1,2,…k。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010997808.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置