[发明专利]基于模式识别的时序数据预测系统及方法有效
申请号: | 201910877488.9 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110659681B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 高冲 | 申请(专利权)人: | 上海仪电(集团)有限公司中央研究院 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06N20/00;G06Q10/04 |
代理公司: | 上海容慧专利代理事务所(普通合伙) 31287 | 代理人: | 于晓菁 |
地址: | 200233 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模式识别 时序 数据 预测 系统 方法 | ||
1.一种基于模式识别的时序数据预测系统,其特征在于,包括时序数据接口模块、数据预处理模块、窗口切分模块、训练模块和推理模块,所述时序数据接口模块用于同时接收来自多个不同来源的时序数据,所述时序数据的数据格式中至少包含时间戳和数值两个字段,所述数据预处理模块用于时序数据的预处理,所述窗口切分模块用于将连续时序数据切分为不同时间维度的分段数据,所述训练模块用于算法模型的训练过程,所述推理模块用于实时的数据预测推理;所述数据预处理模块包括缺失数据补全、数据异常值去除和数据归一化,所述训练模块包括特征提取器、聚类器、聚合器、分类器和变点检测器,所述推理模块包括预测模型单元和预测效果评估单元。
2.一种基于模式识别的时序数据预测方法,其特征在于,基于如权利要求1所述系统实现,包括如下步骤:
S1、采集多个不同用户的时序数据,数据预处理后进行数据降维,保留每天采样数据至少包含96个点;
S2、按照14天为一大窗口切分为长窗口子流,以1天为短窗口切分为更细粒度的子流;
S3、在小窗口子流中,利用训练好的特征提取器进行离群点检测,并剔除离群点;
S4、在剔除离群点的数据中使用K-Medoids算法进行聚类,并用DB-index分析获得最佳聚类群;
S5、利用数据聚合,以聚类中心为基础聚合所有类的数据,形成各聚类的特征曲线;
S6、利用模型组合为每个聚类曲线分别训练K个预测模型,通过投票机制获得最终的预测结果,预测结果为下一个短窗口;
S7、同时对K个聚类序列进行EDF变点检测,利用k-Sample Anderson-Darling测试,当p<0.05认为检测到变点,调整K值为K-2到K+2重新进行聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海仪电(集团)有限公司中央研究院,未经上海仪电(集团)有限公司中央研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910877488.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置