[发明专利]一种基于改进LSTM的PM2.5数据异常值检测方法在审
申请号: | 202011333748.5 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112506899A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 徐洪珍;蔡友林;周梁琦;许杰云 | 申请(专利权)人: | 东华理工大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06N3/00;G06N3/04;G06N3/08 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 王颖 |
地址: | 330013 江西*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 lstm pm2 数据 异常 检测 方法 | ||
本发明公开一种基于改进LSTM的PM2.5数据异常值检测方法,包括以下步骤:S1,采集历史PM2.5数据,划分为训练集和测试集;S2,构建进行PM2.5大数据异常值检测的LSTM模型,并初始化所述LSTM模型;S3,采用改进的模拟退火粒子群算法优化所述LSTM模型,利用训练集进行训练,获得满足条件的LSTM模型;S4,利用所述测试集对优化后的LSTM模型进行PM2.5数据测试,获取异常值。本发明的模拟退火粒子群算法基于PM2.5大数据的特点进行改进,使得预测曲线更加平滑的特点对方法进行优化,检测方法针对性强,能得到更好的结果。
技术领域
本发明涉及大数据处理领域,特别是涉及一种基于改进LSTM的PM2.5数据异常值检测方法。
背景技术
异常值检测是大数据处理领域的研究者长期重点关注的课题,该问题在数据预处理、行为预测、行为分析等具体应用上具有广泛的实际应用价值。但同样,该问题具有较大的挑战性。一是在大数据下,这些数据往往呈现结构复杂、噪声多等特性,这已成为人们深度挖掘大数据潜在价值的阻碍。二是传统的异常值检测方法对PM2.5大数据不适用。
目前的PM2.5异常值检测方法主要可以分为基于传统统计学的方法、基于深度学习的聚类方法和基于深度学习的预测方法。基于统计的方法仅适用于低维数值型数据集,且依赖于数据分布、参数分布、期望离群点的数量等指标。基于深度学习的聚类方法需要聚类的数据样本中,正常点占大部分,异常点占极小部分,否则过多的异常样本可能聚为一类从而影响判定。
近年来,基于深度学习的预测方法展现出良好的性能与鲁棒性。然而,该种方法检测PM2.5异常值主要存在以下几个问题:1)LSTM网络的结构复杂,当面临不同特征的PM2.5数据时,调整LSTM的参数需要设计者拥有丰富的神经网络设计与参数调整经验,一个好的神经网络结构通常需要设计者的精心调整,这个过程将花费设计者大量的时间与精力;2)预测过程常常出现收敛速度慢、易陷入局部最优的缺点。
发明内容
本发明的目的是提供一种基于改进LSTM的PM2.5数据异常值检测方法,以解决上述现有技术存在的问题,针对春秋季节风季较多,风力较大,且具有一定的随机性,导致LSTM模型容易学习PM2.5浓度大数据的主要变化趋势,而忽略随机影响,使得预测曲线更加平滑的特点对方法进行优化,针对性强,能得到更好的结果。
为实现上述目的,本发明提供了如下方案:本发明提供一种基于改进LSTM的PM2.5数据异常值检测方法,包括如下步骤:
S1,采集历史PM2.5数据,对所述历史PM2.5数据中的正常值与异常值进行标记,划分训练集和测试集;
S2,构建进行PM2.5大数据异常值检测的LSTM模型,并初始化所述LSTM模型;
S3,采用改进的模拟退火粒子群算法优化所述LSTM模型,利用所述训练集对所述LSTM模型进行训练获得优化后的LSTM模型;
S4,利用所述测试集对优化后的LSTM模型进行PM2.5数据测试,获取异常值。
优选的,所述步骤S2中构建的LSTM模型包括输入层、LSTM层、全连接层和输出层。
优选的,所述输入层神经元个数为24,所述LSTM模型的预测步长初始化为24,所述LSTM层神经元的个数初始化为100,所述全连接层初始化为3层,所述全连接层神经元的个数初始化为50,所述输出层神经元个数为1,用于输出预测的PM2.5浓度数据。
优选的,所述S3中LSTM模型优化包括以下步骤:
S31、初始化模拟退火粒子群算法中的参数;
S32、初始化当前迭代次数;
S33、构建适应度函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华理工大学,未经东华理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011333748.5/2.html,转载请声明来源钻瓜专利网。