[发明专利]一种时间序列的模式聚类方法在审
申请号: | 201710568397.8 | 申请日: | 2017-07-13 |
公开(公告)号: | CN107463947A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 陆成刚 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/14 |
代理公司: | 杭州斯可睿专利事务所有限公司33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时间 序列 模式 方法 | ||
技术领域
本发明涉及时间序列聚类领域,尤其是一种时间序列的模式聚类方法。
背景技术
在时间序列模式聚类中,无论是有监督聚类、还是无监督聚类一般总是要预先设定类别的数目。例如k均值聚类的k值就是k个类别,模糊c均值聚类就是c个类别,而层次聚类可使用类别数目作合并操作循环的终止阈值,相当于仍是预定了类别数。至于有监督聚类时,用于训练学习的标注数据集可以看成已经定义了的类别数目以及对应的各类样本。在类别数目未知下,如何进行无监督聚类学习仍是一个开放的课题。
在时间序列相似(异)性评判时往往使用时域序列的距离来评价,如果考虑将信号转成频域,利用频域的低频段作主成分来进行距离评测,可以忽略时域对比时的高频细节的干扰。此外,通常的距离比对仍有不少缺陷,比如对信号在时间轴上的平移、伸缩乃至对于振幅的压扩都比较敏感。
发明内容
为了克服已有在时间序列模式聚类方式的无法在未知类别数目情况下进行自动聚类的不足,本发明提供一种在未知类别数目情况下实现自动聚类的时间序列的模式聚类方法。
本发明解决其技术问题所采用的技术方案是:
一种时间序列的模式聚类方法,所述模式聚类方法包括以下步骤:
1)设定频谱解析度参数整数数值2N,任何时域长度低于2N的时间序列模式都可以作为输入,当输入长度不满2N时,多余的位置可以使用0填充;
2)将输入的时域序列进行快速傅立叶变换,并计算出频谱,取前半段的谱系数作主成分,长度为N;
3)累计m个时间序列的谱,即m个N维度矢量,计算这m个矢量之间的DTW距离,组成m*m的距离方阵;
4)所述距离方阵逐行遍历,过程为:
设置一个类别序号增加变量,并预先设定2个m维度的标志矢量,矢量一为聚类过程的中间记录参数,记录每一个序列谱的是否已经被访问的情况;矢量二为聚类输出,记录m个谱的分属于各自类的序号;
按行遍历该方阵;
5)当前行是否已经被访问?如是,跳到下一行,继续行遍历该矩阵;如否,将当前行标志为已经访问,且将当前行标注类别序号,即取作类别序号增加变量的当前数值;
6)计算当前行除了主对角元外,数值低于第一固定阈值的元素数目;如果该数目小于第二固定阈值,更新类别序号增加变量,跳到下一行,再回到步骤5);
7)如果该数目大于第二固定阈值,则将当前行的这些元素的列号对应的输入矢量视作当前行的矢量的同类,得到当前行同类的集合Set;
8)逐行遍历步骤7)中得到的所有同类矢量所在的方阵的行,看它是否被访问过,如是跳到下一行,继续遍历同类矢量所在的方阵的行;否则,将当前行标志为已经访问,且将当前行标注类别序号,即取作类别序号增加变量的当前数值;
9)并查看该行除了主对角元外,数值低于第一固定阈值的元素数目,如果该数目低于第二固定阈值,跳到下一行,回到步骤8);如果数目大于第二固定阈值,则将这些新的同类合并到步骤7)得到的同类集Set中,跳到下一行,并且回到步骤8);
直到步骤7)中得到的Set的所有同类矢量所在的方阵的行被遍历完毕;
10)更新类别序号增加变量;
11)继续行遍历该矩阵,跳到下一行,回到步骤5),直到该方阵所有的行都是被访问过了的。
本发明的技术构思为:本发明采用信号的频域低频段部分作DTW距离比对,并在未知类别数目下,能够进行自动聚类,待聚类终止,自动定出数据的类别数目。
本发明的有益效果主要表现在:在未知类别数目情况下实现自动聚类,待聚类终止,自动定出数据的类别数目。
附图说明
图1是一种时间序列的模式聚类方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,一种时间序列的模式聚类方法,包括以下步骤:
1)设定频谱解析度参数整数数值2N,任何时域长度低于2N的时间序列模式都可以作为输入,当输入长度不满2N时,多余的位置可以使用0填充;
2)将输入的时域序列进行快速傅立叶变换,并计算出频谱,取前半段的谱系数作主成分,长度为N;
3)累计m个时间序列的谱,即m个N维度矢量,计算这m个矢量之间的DTW距离,组成m*m的距离方阵;
4)所述距离方阵逐行遍历,过程为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710568397.8/2.html,转载请声明来源钻瓜专利网。