[发明专利]一种基于数据特征片段的时间序列数据分类方法有效

专利信息
申请号: 201810843340.9 申请日: 2018-07-27
公开(公告)号: CN110019421B 公开(公告)日: 2023-09-01
发明(设计)人: 胡宇鹏;罗伟;李学庆;徐鹏涛;丁一明 申请(专利权)人: 山东大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/28
代理公司: 济南金迪知识产权代理有限公司 37219 代理人: 杨树云
地址: 250101 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 特征 片段 时间 序列 分类 方法
【权利要求书】:

1.一种基于数据特征片段的时间序列数据分类方法,其特征在于,该时间序列数据分类方法用于设备运行状态的划分,包括步骤如下:

S1,预设数据趋势点选取率ρ、数据特征片段Shapelets的选取数量阈值Num、数据特征片段Shapelets质量评估标准即信息增益、子类划分标准率μ;

数据特征片段Shapelets的选取数量阈值Num是指最终产生的数据特征片段Shapelets的数量;

信息增益是指某个数据特征片段sub对整个时间序列数据集不确定性减少的程度,对于某个数据特征片段sub,其信息增益gain(sub)计算方式如公式(Ⅰ)所示:

式(Ⅰ)中,D为原始数据集,DL和DR为原始数据集被划分后的两个数据集,n、nL、nR分别为D、DL、DR这三个数据集中包含时间序列的数目;e(D)、e(DL)、e(DR)分别表示D、DL、DR这三个数据集的熵,即数据集中不同类对该数据集造成的影响,假定数据集D中含有c个不同的类,类i中时间序列在数据集中占得比例为pi,则数据集D的熵计算方式如公式(Ⅱ)所示:

S2,针对原始数据集D,选取出表示原始数据集D中所有数据分类特性的时间序列数据集RTS;

S3,针对步骤S2得到时间序列数据集RTS,利用数据趋势点从时间序列数据集RTS中选取相应的数据特征片段Shapelets;

S4,根据上述步骤S3获取到的数据特征片段Shapelets,采用标准化的数据特征片段转换操作,形成数据特征矩阵;

S5,利用步骤S4形成的数据特征矩阵后,采用ST算法完成最后的时间序列分类操作。

2.根据权利要求1所述的一种基于数据特征片段的时间序列数据分类方法,其特征在于,所述步骤S2,包括步骤如下:

a.对原始数据集D中的全部时间序列按照其类标签进行划分,并在每个类的全体时间序列中寻找该类的中心序列,所述中心序列是指某一分类中到其它时间序列的累加距离最小的一条时间序列Tcen;

b.根据步骤a找到的中心序列,计算每个类中的每个时间序列与中心序列的距离,按照从小到大的顺序进行重新排序,并利用子类划分的标准率μ对每个类中全体时间序列进行子类划分;

c.在步骤b得到的每一个子类中,选择到该子类中其它时间序列的累加距离最短的时间序列,作为该子类的数据特征序列,按照此操作,从原始数据集D中每一个子类选取出一条数据特征序列,组成相应的时间序列数据集RTS。

3.根据权利要求2所述的一种基于数据特征片段的时间序列数据分类方法,其特征在于,所述距离是指欧氏距离或动态时间弯曲距离。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810843340.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top