[发明专利]一种基于动态时间规整均值的矢量聚类方法在审

专利信息
申请号: 201611107523.1 申请日: 2016-12-06
公开(公告)号: CN106599912A 公开(公告)日: 2017-04-26
发明(设计)人: 陆成刚 申请(专利权)人: 浙江工业大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 杭州斯可睿专利事务所有限公司33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 动态 时间 规整 均值 矢量 方法
【说明书】:

技术领域

本发明属于矢量聚类领域,尤其涉及一种矢量聚类方法。

背景技术

矢量聚类又称向量聚类,有很多种实现方法或模式,如层次矢量聚类、k均值矢量聚类、模糊c均值聚类等等。本案是有关k均值聚类法的。k均值聚类法是一种局部寻优的聚类法,虽然不具备层次聚类法那样免于陷入局部最优的特性,但由于其计算高效、适用面广仍被广泛关注和研究。另外,k均值聚类是一种无监督聚类法,不需要事先依赖于人工标注数据集的离线训练,但需要事先确定待分类类型的数目。

动态时间规整(简称DTW,即Dynamic Time Warping)是一种计算两个序列之间相似性的距离度量。它和普通的欧式距离以及与欧式距离等价的各类距离在计算、应用上有显著的不同和优势,主要是DTW距离对参与计算的两个序列的长短(可视作两个矢量的维数)没有相同长度的要求,它既能处理相同长度、也能处理不同长度间的计算;更重要的是它能抓住序列在时间轴上的伸缩差异的自然特性并屏蔽这种差异的影响,从而使得计算的结果更加合理、符合人类主观判断相似性(或差异性)的要求。例如,对于序列(a,a,b,a)和序列(a,b,b,a)的相似度量的计算:依照传统欧式距离的差异度量为||b-a||^2;而按照DTW计算差异为0。后者更符合人类的判断,因而DTW距离在语音识别、时间序列模式处理中具有广泛的用途。

申请专利“一种时间序列波峰的提取方法”(申请号2016108211635)对候选波峰进行甄别环节(波峰提取的最后一个环节)处理时需要依赖预设的阈值参数,在该申请专利(2016108211635)设计的方法中使用计算波峰的面积参数来甄别。本案设计一种规避预设阈值的自适应甄别法,考虑到这些候选波峰的序列长度都不一致的情况,采用基于动态时间规整均值DTWA(Dynamic Time Warping Averaging)的矢量聚类法实现。

经典的k均值聚类法描述:理论上它致力于最小化如下目标函数

上式中对于待分类的矢量集合分成确定的c类。在某次聚类时分到第j类就记为上式的含义是经过若干次聚类分类后使得目标函数数值最小。经典的k均值聚类执行步骤为

1)初始化,随机选取c类聚类初值中心j=1,...,c,令t=1;

2)把分类到各个类里,使用最近距离分类法,例如当到第j类的均值中心的距离小于到其余各类的均值中心的距离时,把分到第j类,从而记作t-1表示是第t-1次分类,分到第j类的矢量的最终数目为

3)根据第t-1次分类的结果,更新用于第t次分类的均值中心

4)判断结束聚类迭代的条件是否满足,满足则结束;否则,t递增1,回到步骤2。

上述算法可以从理论上证明满足如下不等式

故以上算法是收敛的。只不过对于目标优化而言,如上的均值聚类迭代法是局部最优法,不是全局最优。但由于该方法计算效率高、自适应性强、应用面广,所以在无监督模式分类里具有广泛的用途。但是这个方法要求待分类的矢量集的维数是一致的、统一的,不能处理维数不同的情况;此外,该方法基于欧式距离,对于矢量之间的相似、差异计算不是那么合乎人类的主观感受。

发明内容

为了克服已有矢量聚类方法的不能适用于维数不同的情况、不符合主观判断的不足,本发明提供了一种有效适用于维数不同的情况、更加符合主观判断的基于动态时间规整均值的矢量聚类方法。

本发明解决其技术问题所采用的技术方案是:

一种基于动态时间规整均值的矢量聚类方法,包括以下步骤:

1)初始化,随机选取c类聚类初值中心j=1,...,c,令t=1;

2)把分类到各个类里,使用DTW距离分类法,当到第j类的均值中心的DTW距离小于到其余各类的均值中心的DTW距离时,把分到第j类,从而记作t-1表示是第t-1次分类,最终分到第j类的矢量的数目为

3)由第t-1次分类的结果,更新用于第t次分类的均值中心逐个计算最后的就是即步骤如下:

3.1)从随机选一个矢量,记为令且h=1;

3.2)从其余的矢量中选出第h个矢量将与依照DTW距离模式作时间对齐,即假设为n维、为m维,依照DTW距离模式的时间对齐是指建立两个矢量的维数序号的对应关系,即维数序号

1=(i)1<=(i)2<=...<=(i)max{n,m}=n

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611107523.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top