[发明专利]一种基于分段统计特征距离的聚类方法有效
申请号: | 201910039709.5 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109829487B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 何光宇;郏琨琪;郭歌;何果红 | 申请(专利权)人: | 上海上塔软件开发有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201403 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分段 统计 特征 距离 方法 | ||
1.一种基于分段统计特征距离的聚类方法,其特征在于:包括
步骤一:将分段统计距离作为相似性度量;从子序列中提取均值、线性拟合斜率和持续时间作为特征向量,通过加权欧几里德距离对提取的不同特征向量进行相似度匹配,并通过权重向量区别不同特征向量的表现度,使分段统计距离对有效信息敏感;
步骤二:通过k-中心点聚类算法生成模式模板;给定分段时间序列以及少量标记的子序列并将子序列作为标记样本,通过聚类算法利用标记样本初始化聚类中心从而输出预测的聚类分区以及最终相应的聚类中心CC;
步骤三:从聚类结果的性能中提取学习最优权重向量Wopt,并引入宏-F1 指标作为聚类一个性能度量指标,将最优的决定权重值的问题转化为有约束的最优化问题;
其中,步骤一包括:
S1:给定两个子序列S[i,j]、S[i′,j′]和一个映射函数F(·),从子序列中S[i,j],S[i′,j′]分别提取功率均值线性拟合斜率slope[i,j]、slope[i′,j′]持续时间τ[i,j]、τ[i′,j′],并生成特征向量V[i,j]与V[i′,j′];
其中,
S2:根据特征向量生成权重向量并通过公式计算S[i,j]与S[i′,j′]之间的分段统计距离;
其中为特征向量的第i个元素的权重;
步骤三包括,最优的决定权重值的问题转化为有约束的最优化问题的公式为:通过标记样本初始化聚类中心时,在迭代期间不改变聚类和这些标记样本之间的关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海上塔软件开发有限公司,未经上海上塔软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910039709.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理方法和装置
- 下一篇:一种头颈部癌症局部复发预测装置