[发明专利]一种基于模式关联分析的实值时间序列规则发现方法和装置在审
申请号: | 201810241305.X | 申请日: | 2018-03-22 |
公开(公告)号: | CN108647223A | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 王亚沙;何远舵;彭广举;初旭;王江涛 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主题模式 时间序列 方法和装置 关联分析 关联关系 规则发现 候选规则 自动提取 关联分析模块 使用者需求 调整模式 发现模块 配对关系 配对结果 评分模块 通过模式 意义信息 主题发现 偏好 预设 分析 | ||
本发明涉及一种基于模式关联分析的实值时间序列规则发现方法和装置。该方法包括以下步骤:1)针对一个或多个实数值的目标时间序列,利用主题发现技术从中自动提取多种长度的主题模式;2)针对每一对主题模式,根据其在时间序列中出现的位置以及间隔,分析两者之间的配对关系;3)根据一对主题模式的配对结果,对该对主题模式所构成的候选规则进行评分,并选择评分超过预设的阈值的候选规则作为规则。该装置包括主题模式发现模块、主题模式关联分析模块和规则评分模块。本发明能够高效地自动提取蕴含有意义信息的模式;可以根据使用者需求调整模式的偏好;通过模式间的关联关系能够找到有一定关联关系规则,避免了无效规则。
技术领域
本发明涉及一种实值时间序列规则发现方法,属于时间序列数据挖掘领域,具体涉及一种基于模式关联分析的实值时间序列规则发现方法和装置。
背景技术
随着传感器和物联网技术的发展,我们可以轻松地感知收集信息空间和物理空间中对象的感知数据。这些数据往往随时间采样得到,天然形成了实值时间序列数据。由于感知对象之间往往存在着关联关系,这些关系也会相应地体现在它们的时间序列数据上。这种时间序列上存在的关联关系称之为规则。挖掘这些规则能够发掘数据背后对象间的相互作用关系,有助于理解对象间的关联关系。此外,利用这些规则也可以实现预测等任务。
1998年Das等人最早提出了一种针对实值时间序列数据规则发现的方法。该方法首先利用子序列聚类符号化原始的实值时间序列,然后基于J-measure为所有可能的规则进行评分,最终选择分高的作为规则。然而,这种方法理论上虽然可行,但是在实际使用中子序列聚类会丢失原始时间序列中的大量信息,导致最终找到的规则完全无法使用。
2015年,Yekta等人在KDD数据挖掘会议上提出了一种基于子序列划分的规则发现方法。该方法假定规则位于时间序列的子序列中,然后把子序列切分为两段,前段是规则的前件,而后段则是规则的后件。为了快速定位规则可能存在的子序列,该方法进一步采用了主题发现(motif discovery)技术,把主题子序列作为待切分的目标子序列,从而加快规则的发现过程。然而,规则前件和后件之间通常会存在一定的时间间隔,这种基于切分的方法会把间隔中的子序列划分到规则的前件或后件当中,从而使得规则不准确。除此之外,这一方法也无法应用于多时间序列的情景。
发明内容
本发明主要是解决现有技术所存在的问题,提出了一种基于模式关联分析的实值时间序列规则发现方法和装置。利用该方法,可以自动地从实数值时间序列中提取有意义的关联规则,进而可以实现数据的理解或预测。
本发明的上述技术问题主要是通过下述技术方案得以解决的:
一种基于模式关联分析的实值时间序列规则发现方法,包括:
主题模式发现步骤,针对一个或多个实数值的目标时间序列,利用主题发现技术,从中自动提取多种长度的主题模式;
主题模式关联分析步骤,针对每一对主题模式,根据其在时间序列中出现的位置以及间隔,分析两者之间的配对关系;
规则评分步骤,根据一对主题模式的配对结果,对该对主题模式所构成的候选规则进行评分,根据评分高低排列候选规则,根据实际应用问题设定阈值,选择评分超过阈值的候选规则作为最终规则。
优化的,上述的一种基于模式关联分析的时间序列规则发现方法,所述主题模式发现步骤中,所述主题发现技术基于MK算法:
给定主题模式长度参数m,用长为m的滑动窗口提取目标时间序列的全部子序列,选择其中一个子序列作为参考点,记为s0,计算其他子序列到该子序列的z变换后的欧氏距离,z变换和欧氏距离的具体公式是(1)、(2),其中s表示一个子序列,mean(s)表示子序列s的平均值,std(s)表示子序列s的标准差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810241305.X/2.html,转载请声明来源钻瓜专利网。