[发明专利]一种基于多样性shapelet的时间序列早期分类方法及设备在审
申请号: | 201811441385.X | 申请日: | 2018-11-29 |
公开(公告)号: | CN109376799A | 公开(公告)日: | 2019-02-22 |
发明(设计)人: | 李桂玲;闫汶和 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 郝明琴 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于多样性shapelet的时间序列早期分类方法及设备,基于多样性shapelet的时间序列早期分类方法,是基于预测起点的shapelet剪枝算法,对时间序列进行shapelet提取,结合通过相似性度量计算A长度的shapelet的距离阈值和质量评价分数,进行shapelet选择;经过两次shapelet提取和shapelet选择,训练得到对时间序列进行分类的模型核特征集S2,根据训练得到的核特征集S2,对实际时间序列进行分类。本发明的有益效果是:通过提出的时间序列的相似性度量、基于预测起点的shapelet剪枝算法和扩展自相似性,提高了对时间序列进行分类的效率和精确性,保留了shapelet的多样性。 | ||
搜索关键词: | 时间序列 分类 多样性 剪枝算法 特征集 相似性度量计算 相似性度量 质量评价 预测 保留 | ||
【主权项】:
1.一种基于多样性shapelet的时间序列早期分类方法,其特征在于:包括以下步骤:S101:基于shapelet剪枝算法,设置shapelet的最短长度minL和最长长度maxL,对训练集中的时间序列提取长度为A的所有shapelet;A=minL+(n‑1)D,D为固定步长,maxL>=A>=minL,minL、maxL和D均为正数,n为正整数;S102:通过相似性度量计算所提取的shapelet的距离阈值和质量评价分数,对提取到的A长度的shapelet进行排序,得到初始特征集F1;相似性度量即指所提取的shapelet到一个时间序列的距离;S103:根据初始特征集F1,剔除质量评价分数最低的若干shapelet,剩余的shapelet组成核特征集S1,核特征集S1中的shapelet的起点组成预测起点集SP1;S104:根据预测起点集SP1,以预测起点集SP1中各元素为起点,对训练集中的时间序列进行B长度的shapelet提取,通过相似性度量计算B长度的shapelet的距离阈值和质量评价分数,对提取到的B长度的shapelet进行排序,得到特征集F2;maxL>=B>=minL,B为正数,且B不等于A;S105:合并初始特征集F1和特征集F2,得到特征集F3;S106:根据特征集F3中的shapelet质量评价分数和扩展自相似性关系,剔除特征集F3中质量评价分数最低的shapelet及相似性最高的shapelet,由剩余的shapelet组成核特征集S2;核特征集S2为训练得到的模型;S107:根据得到的核特征集S2,对实际时间序列进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811441385.X/,转载请声明来源钻瓜专利网。