[发明专利]一种基于分段统计特征距离的聚类方法有效

专利信息
申请号: 201910039709.5 申请日: 2019-01-16
公开(公告)号: CN109829487B 公开(公告)日: 2021-05-14
发明(设计)人: 何光宇;郏琨琪;郭歌;何果红 申请(专利权)人: 上海上塔软件开发有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 201403 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分段 统计 特征 距离 方法
【说明书】:

发明公开了数据压缩领域的一种基于分段统计特征距离的聚类方法,步骤一:将分段统计距离作为相似性度量;步骤二:通过k‑中心点聚类算法生成模式模板;步骤三:从聚类结果的性能中提取学习最优权重向量Wopt,并引入宏‑F1指标作为聚类一个性能度量指标,将最优的决定权重值的问题转化为有约束的最优化问题。本发明提供的一种基于分段统计特征距离的聚类方法能可以用于提升聚类的效果,使得反映电器相似工作状态的子序列可以被聚类到一起。并且,相比于基于DTW和DDTW的相似性度量,基于分段统计距离的相似性度量在模式发现方面有显著的效果提升。

技术领域

本发明涉及数据压缩领域,具体涉及一种基于分段统计特征距离的聚类方法。

背景技术

在智能用电网络中,对于用电数据时间序列的压缩表示是一个关键的问题。在线基于模式的近似表示是一种有效的解决方法,其中模式发现考虑到模式发现在很大程度上取决于相似性度量。具体来说,模式发现的目的是找到合适的模式模板来进行时间序列的近似表示,而选择合适的相似性度量对于模式发现具有重要的意义。

Lp-范数距离和动态时间规整(DTW)是两种常用的度量时间序列相似性的方法。

Lp-范数距离分别是曼哈顿距离、欧几里得距离和最大距离p=1、p=2、p→∞,并要求两个时间序列的维数相等。然而,实际的时间序列往往不能满足这个要求。

与Lp-范数距离不同,动态时间规整基于动态规划,通过对时间序列指标的重新调整来计算距离,已经在许多领域得到成功应用。动态时间规整对时变和相移不敏感,但计算量大(O(n2)),难以处理高维时间序列和高速数据流。此外,表现为一个时间序列上的单个点映射到另一个时间序列的大部分的不希望看到的行为“奇点”也困扰着动态时间规整。为了解决这个问题,文献“roceedings of the 2001 SIAM International Conference onData Mining”(Keogh E J,Pazzani M J.Derivative dynamic time warping[C],Societyfor Industrial and Applied Mathematics,2001-1-11)提出了导数动态时间规整(DDTW),但是它仅考虑数据的局部导数而不考虑原始数据,以找到正确的规整。

技术方案

为实现以上目的,本发明通过以下技术方案予以实现:

一种基于分段统计特征距离的聚类方法,包括

步骤一:将分段统计距离作为相似性度量;从子序列中提取均值、线性拟合斜率和持续时间作为特征向量,通过加权欧几里德距离对提取的不同特征向量进行相似度匹配,并通过权重向量区别不同特征向量的表现度,使分段统计距离对有效信息敏感;

步骤二:通过k-中心点聚类算法生成模式模板;给定分段时间序列以及少量标记的子序列并将子序列作为标记样本,通过聚类算法利用标记样本初始化聚类中心从而输出预测的聚类分区以及最终相应的聚类中心cc;

步骤三:从聚类结果的性能中提取学习最优权重向量Wopt,并引入宏-F1指标作为聚类一个性能度量指标,将最优的决定权重值的问题转化为有约束的最优化问题;

其中,步骤一包括:

S1:给定两个子序列S[i,j]、S[i′,j′]和一个映射函数F(·),从子序列中S[i,j],S[i′,j′]分别提取功率均值线性拟合斜率slope[i,j]、slope[i′,j′]持续时间τ[i,j]、τ[i′,j′],并生成特征向量V[i,j]与V[i′,j′]

其中,

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海上塔软件开发有限公司,未经上海上塔软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910039709.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top