[发明专利]一种基于特征重校准机制的时序数据分类方法及系统在审

专利信息
申请号: 202110414467.0 申请日: 2021-04-16
公开(公告)号: CN113111948A 公开(公告)日: 2021-07-13
发明(设计)人: 张凯;姚丽;杨光远;逯天斌 申请(专利权)人: 广东众聚人工智能科技有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 北京中和立达知识产权代理事务所(普通合伙) 11756 代理人: 孟姣
地址: 519000 广东省珠海*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 特征 校准 机制 时序 数据 分类 方法 系统
【说明书】:

发明提供了一种基于特征重校准机制的时序数据分类方法及系统。该方案包括获取样本数据进行预处理,生成处理后的样本数据,生成样本空间,预处理包括异常值筛选、异常值替换和归一化处理;对样本空间中数据进行两种预设尺度的切分,生成第一子时序数据和第二子时序数据,将第一子时序数据作为CNN模型的输入,将第二子时序数据作为所述CNN模型中注意力机制模块的输入,生成LSTM并行融合数据;获得训练用输入向量,通过训练获得注意力权重;获取所述LSTM并行融合数据和所述注意力权重,进行加权求和,生成目标特征重校准输出。该方案在CNN基础上在空间进行加权输入特征,关注特定空间区域,并进行特征重校准,集中学习重要数据特征,提升分类精度。

技术领域

本发明涉及数据挖掘技术领域,更具体地,涉及一种基于特征重校准机制的时序数据分类方法及系统。

背景技术

随着5G、互联网和物联网的发展,生活中成千上万的设备以及数以百万计的传感器,每秒产生百万条的时序数据,这使得时序数据的数据量急剧膨胀,而对这些时序数据进行研究和处理,找出其中蕴含的变化规律已经成为一个热门话题。其中,时序数据分类在时序数据研究中具有重要意义,是数据挖掘中一个具有挑战性的问题。

但现有的时序数据分类方案,可以分为基于距离的方法和基于特征的方法。具体的存在以下缺陷:基于距离就是通过设计准确的相似性度量方法,度量时序对象之间的相似性从而进行分类;基于特征就是通过特征提取、模型匹配等技术奖时序数据转化为特征表示活模型参数,再进行分类。但是上述方法都有一些不足:基于距离的方法计算复杂度较高,基于特征的方法,在特征提取时忽略对于粗细粒度特征、全局和局部特征以及特征重要程度差异性的区分,从而导致分类精度不高。

发明内容

鉴于上述问题,本发明提出了一种基于特征重校准机制的时序数据分类方法及系统,对给定的时间序列集合在CNN的基础上,在空间或通道上加权全局输入特征,从而达到关注特定空间区域或通道的目的,进一步进行特征重校准,再次集中学习更重要的数据特征,提升分类的精度。

根据本发明实施例的第一方面,提供一种基于特征重校准机制的时序数据分类方法,具体包括:

获取样本数据进行预处理,生成处理后的样本数据,生成样本空间,所述预处理包括异常值筛选、异常值替换和归一化处理;

对所述样本空间中的数据进行两种预设尺度的切分,生成第一子时序数据和第二子时序数据,所述第一子时序数据和所述第二子时序数据均为二阶数据矩阵;

将所述第一子时序数据作为CNN模型的输入,将第二子时序数据作为所述CNN模型中注意力机制模块的输入,生成LSTM并行融合数据;

获得训练用输入向量,通过训练获得注意力权重;

获取所述LSTM并行融合数据和所述注意力权重,进行加权求和,生成目标特征重校准输出。

在一个或多个实施例中,优选地,所述获取样本数据进行预处理,生成处理后的样本数据,生成样本空间,所述预处理包括异常值筛选、异常值替换和归一化处理,具体包括:

获取所述样本数据,通过分位差法或标准差法中的一种进行所述异常值筛选,标记对应的异常值,其中,所述标准差法为使用所述样本数据筛选均值的二倍标准差范围,所述分位差法为使用上下4分位数差进行所述样本数据中所述异常值的筛选;

对所述异常值进行替换处理,所述替换处理包括采用前后k个值的平均值进行替换,并将替换所述异常值后的所述样本数据保存为中间样本数据;

对所述中间样本数据进行归一化处理,生成所述样本空间,其中,所述归一化处理为线性函数归一化,将原始数据按照最大值和最小值进行数据的线性转换,转换为最大值为1最小值为0的数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东众聚人工智能科技有限公司,未经广东众聚人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110414467.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top