[发明专利]一种基于模式关联分析的实值时间序列规则发现方法和装置在审
申请号: | 201810241305.X | 申请日: | 2018-03-22 |
公开(公告)号: | CN108647223A | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 王亚沙;何远舵;彭广举;初旭;王江涛 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 主题模式 时间序列 方法和装置 关联分析 关联关系 规则发现 候选规则 自动提取 关联分析模块 使用者需求 调整模式 发现模块 配对关系 配对结果 评分模块 通过模式 意义信息 主题发现 偏好 预设 分析 | ||
1.一种基于模式关联分析的实值时间序列规则发现方法,其特征在于,包括以下步骤:
1)针对一个或多个实数值的目标时间序列,利用主题发现技术从中自动提取多种长度的主题模式;
2)针对每一对主题模式,根据其在时间序列中出现的位置以及间隔,分析两者之间的配对关系;
3)根据一对主题模式的配对结果,对该对主题模式所构成的候选规则进行评分,并选择评分超过预设的阈值的候选规则作为规则。
2.如权利要求1所述的方法,其特征在于,步骤1)所述主题发现技术基于MK算法,提取主题模式的步骤包括:
1-1)给定主题模式长度参数m,用长为m的滑动窗口提取目标时间序列的全部子序列,选择其中一个子序列作为参考点,计算其他子序列到该子序列的z变换后的欧氏距离;
1-2)将得到的欧式距离按照从小到大排列,然后计算相邻两点的到参考点距离的差;按距离差从小到大的顺序计算相应两点的真实距离,并记录当前最小值,当该最小值小于当前待计算的两点相对距离的差时,停止计算,当前最小值所对应的两个子序列则是主题模式。
3.如权利要求2所述的方法,其特征在于,步骤1)在应用MK算法时,排除时间窗口相邻的子序列,其方法是:设置一个排除区间,该排除区间的长度是子序列长度的一半,即m/2,当两个子序列的起始位置之差小于m/2时,这两个子序列的真实距离记为正无穷。
4.如权利要求2所述的方法,其特征在于,步骤1)在应用MK算法之前,对不感兴趣的子序列进行过滤;通过度量子序列是否有意义来判断是否为感兴趣的子序列,度量子序列是否有意义的公式是:
其中Roughness(s)表示时间序列子序列s的曲折程度,曲线越曲折,该值越大;该公式假设时间序列所描述的对象没有事件发生时,感知信号是平坦的,而当有意义事件发生时,感知信号是曲折的。
5.如权利要求2所述的方法,其特征在于,步骤1)在应用MK算法时,一次只找到属于同一个主题中的最近的两个子序列,然后寻找其他同样属于该主题的子序列;找到同属于同一个主题的子序列之后,进一步寻找相同长度的其他主题的子序列。
6.如权利要求5所述的方法,其特征在于,所述寻找其他同样属于该主题的子序列的方法是:
给定一个范围参数R,R>1,记两个已经找到的子序列为s1,s2,考虑满足如下公式中任意一个的子序列s:
遍历这些子序列,计算它们到s1或s2的真实距离,如果该距离满足以下公式,则将这些子序列加入该主题的子序列中,
7.如权利要求5所述的方法,其特征在于,所述寻找相同长度的其他主题的子序列,结合MK算法和过滤,当找到一个主题的全部子序列之后,将这些子序列过滤掉,然后对剩余子序列重新利用MK算法。
8.如权利要求1所述的方法,其特征在于,步骤2)通过计算以下两个优化问题来分析一对主题模式的配对关系,其中xi,j是待关联的两个主题中第i个子序列和第j个子序列的关联关系,取值是1或0;1代表两者存在配对关系,0代表两者不存在配对关系;wi,j为这两个子序列之间的时间间隔;
第一个优化问题:
xi,j∈{0,1};
第二个优化问题:
xi,j∈{0,1},
∑xi,j=p;
其中,第一个优化问题试图寻找尽可能多的配对数目,记求解该问题能够找到最多配对数目是p;然后求解第二个优化问题,该问题试图寻找配对个数是p时,平均时间间隔最小的配对情形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810241305.X/1.html,转载请声明来源钻瓜专利网。