[发明专利]基于模式识别的时序数据预测系统及方法有效
申请号: | 201910877488.9 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110659681B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 高冲 | 申请(专利权)人: | 上海仪电(集团)有限公司中央研究院 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06N20/00;G06Q10/04 |
代理公司: | 上海容慧专利代理事务所(普通合伙) 31287 | 代理人: | 于晓菁 |
地址: | 200233 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模式识别 时序 数据 预测 系统 方法 | ||
本发明公开了一种基于模式识别的时序数据预测系统及方法,系统包括时序数据接口模块、数据预处理模块、窗口切分模块、训练模块和推理模块,时序数据接口模块用于同时接收来自多个不同来源的时序数据,时序数据格式中至少包含时间戳和数值字段,数据预处理模块用于时序数据的预处理,窗口切分模块用于将连续时序数据切分为不同时间维度的分段数据,训练模块用于算法模型的训练过程,推理模块用于实时数据预测推理。本发明能够针对多个时序数据源构建统一的数据预测模型,解决不同数据源的预测问题,不需要额外为每个企业/个人分别构建预测模型,同时利用模式识别构建不同序列数据的分类体系,形成对预测模型的增强,提升预测准确性和预测效率。
技术领域
本发明属于人工智能技术在水务行业的应用,具体涉及一种基于模式识别的时序数据预测系统及方法。
背景技术
目前水务行业对于用水量等时序数据的预测分析更多是基于统计特性和历史周期特性进行简单的预测分析,同时,针对某一特定类型用户或企业的用水量拟合出一个模型是无法直接迁移到其它用户或企业的,因此为了解决预测问题,需要针对每个类型或单独的企业用户分别构建算法模型。CN108133322A公开了一种基于时序运行模拟的电力电量平衡指标计算方法,未检索到应用于水务行业的基于模式识别的时序数据预测方法的国内专利。由于每个时序数据的曲线特征存在具有一定差别性的特征模式,如何利用对这些特征模式的识别构建更加准确地预测算法模型是一个值得探索的领域。
发明内容
有鉴于此,本发明的目的是提供一种基于模式识别的时序数据预测系统及方法,以解决现有技术中的不足。
为了达到上述目的,本发明的目的是通过下述技术方案实现的:
一方面,提供一种基于模式识别的时序数据预测系统,其中,包括时序数据接口模块、数据预处理模块、窗口切分模块、训练模块和推理模块,所述时序数据接口模块用于同时接收来自多个不同来源的时序数据,所述时序数据的数据格式中至少包含时间戳和数值两个字段,所述数据预处理模块用于时序数据的预处理,所述窗口切分模块用于将连续时序数据切分为不同时间维度的分段数据,所述训练模块用于算法模型的训练过程,所述推理模块用于实时的数据预测推理。
上述基于模式识别的时序数据预测系统,其中,所述数据预处理模块包括缺失数据补全、数据异常值去除和数据归一化。
上述基于模式识别的时序数据预测系统,其中,所述训练模块包括特征提取器、聚类器、聚合器、分类器和变点检测器。
上述基于模式识别的时序数据预测系统,其中,所述推理模块包括预测模型单元和预测效果评估单元。
另一方面,提供一种基于模式识别的时序数据预测方法,其中,基于如任意一项上述系统实现,包括如下步骤:
S1、采集多个不同用户的时序数据,数据预处理后进行数据降维,保留每天采样数据至少包含96个点;
S2、按照14天为一大窗口切分为长窗口子流,以1天为短窗口切分为更细粒度的子流;
S3、在小窗口子流中,利用训练好的特征提取器进行离群点检测,并剔除离群点;
S4、在剔除离群点的数据中使用K-Medoids算法进行聚类,并用DB-index分析获得最佳聚类群;
S5、利用数据聚合,以聚类中心为基础聚合所有类的数据,形成各聚类的特征曲线;
S6、利用模型组合为每个聚类曲线分别训练K个预测模型,通过投票机制获得最终的预测结果,预测结果为下一个短窗口;
S7、同时对K个聚类序列进行EDF变点检测,利用k-Sample Adnerson-Darling测试,当p<0.05认为检测到变点,调整K值为K-2到K+2重新进行聚类。
本发明技术方案的有益效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海仪电(集团)有限公司中央研究院,未经上海仪电(集团)有限公司中央研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910877488.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置