[发明专利]一种基于多样性shapelet的时间序列早期分类方法及设备在审
申请号: | 201811441385.X | 申请日: | 2018-11-29 |
公开(公告)号: | CN109376799A | 公开(公告)日: | 2019-02-22 |
发明(设计)人: | 李桂玲;闫汶和 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 郝明琴 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时间序列 分类 多样性 剪枝算法 特征集 相似性度量计算 相似性度量 质量评价 预测 保留 | ||
1.一种基于多样性shapelet的时间序列早期分类方法,其特征在于:包括以下步骤:
S101:基于shapelet剪枝算法,设置shapelet的最短长度minL和最长长度maxL,对训练集中的时间序列提取长度为A的所有shapelet;A=minL+(n-1)D,D为固定步长,maxL>=A>=minL,minL、maxL和D均为正数,n为正整数;
S102:通过相似性度量计算所提取的shapelet的距离阈值和质量评价分数,对提取到的A长度的shapelet进行排序,得到初始特征集F1;相似性度量即指所提取的shapelet到一个时间序列的距离;
S103:根据初始特征集F1,剔除质量评价分数最低的若干shapelet,剩余的shapelet组成核特征集S1,核特征集S1中的shapelet的起点组成预测起点集SP1;
S104:根据预测起点集SP1,以预测起点集SP1中各元素为起点,对训练集中的时间序列进行B长度的shapelet提取,通过相似性度量计算B长度的shapelet的距离阈值和质量评价分数,对提取到的B长度的shapelet进行排序,得到特征集F2;maxL>=B>=minL,B为正数,且B不等于A;
S105:合并初始特征集F1和特征集F2,得到特征集F3;
S106:根据特征集F3中的shapelet质量评价分数和扩展自相似性关系,剔除特征集F3中质量评价分数最低的shapelet及相似性最高的shapelet,由剩余的shapelet组成核特征集S2;核特征集S2为训练得到的模型;
S107:根据得到的核特征集S2,对实际时间序列进行分类。
2.如权利要求1所述的一种基于多样性shapelet的时间序列早期分类方法,其特征在于:在步骤S102和S104中,采用基于序列变化趋势的欧拉距离计算shapelet到时间序列之间的距离。
3.如权利要求1所述的一种基于多样性shapelet的时间序列早期分类方法,其特征在于:在步骤S102和步骤S104中,
质量评价分数用Utility来表示,Utility用于衡量shapelet质量的好坏:
其中,Precision表示f在D中能正确分类的样本的比例,f表示所有shapelet,D表示训练集,且:
WReacll代表了该shapelet在整个训练集上的早期性,T表示一段连续的时间序列,δ表示该shapelet的距离阈值,c表示该shapelet所属的类别,dist(f,T)表示shapelet f与时间序列T的距离,∧表示与,C(T)=c表示时间序列T属于类别c。
4.如权利要求1或3所述的一种基于多样性shapelet的时间序列早期分类方法,其特征在于:在步骤S102和步骤S104中,根据核密度估计方法,通过概率密度函数计算shapelet的距离阈值。
5.如权利要求1所述的一种基于多样性shapelet的时间序列早期分类方法,其特征在于:在步骤S106中,若某一个shapelet到训练集中某时间序列的距离小于该shapelet的距离阈值,且所述某时间序列的类别和该shapelet的类别一致,则所述某时间序列被所述某一个shapelet覆盖,并标记被所述某一个shapelet覆盖的所述某时间序列,标记过的时间序列在以后的步骤中不再进行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811441385.X/1.html,转载请声明来源钻瓜专利网。