[发明专利]一种基于改进LSTM的PM2.5数据异常值检测方法在审
申请号: | 202011333748.5 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112506899A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 徐洪珍;蔡友林;周梁琦;许杰云 | 申请(专利权)人: | 东华理工大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06N3/00;G06N3/04;G06N3/08 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 王颖 |
地址: | 330013 江西*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 lstm pm2 数据 异常 检测 方法 | ||
1.一种基于改进LSTM的PM2.5数据异常值检测方法,其特征在于,包括如下步骤:
S1,采集历史PM2.5数据,对所述历史PM2.5数据中的正常值与异常值进行标记,划分训练集和测试集;
S2,构建进行PM2.5大数据异常值检测的LSTM模型,并初始化所述LSTM模型;
S3,采用改进的模拟退火粒子群算法优化所述LSTM模型,利用所述训练集对所述LSTM模型进行训练获得优化后的LSTM模型;
S4,利用所述测试集对优化后的LSTM模型进行PM2.5数据测试,获取异常值。
2.根据权利要求1所述的基于改进LSTM的PM2.5数据异常值检测方法,其特征在于:所述步骤S2中构建的LSTM模型包括输入层、LSTM层、全连接层和输出层。
3.根据权利要求2所述的基于改进LSTM的PM2.5数据异常值检测方法,其特征在于:所述输入层神经元个数为24,所述LSTM模型的预测步长初始化为24,所述LSTM层神经元的个数初始化为100,所述全连接层初始化为3层,所述全连接层神经元的个数初始化为50,所述输出层神经元个数为1,用于输出预测的PM2.5浓度数据。
4.根据权利要求1所述的基于改进LSTM的PM2.5数据异常值检测方法,其特征在于:所述S3中LSTM模型优化包括以下步骤:
S31、初始化模拟退火粒子群算法中的参数;
S32、初始化当前迭代次数;
S33、构建适应度函数;
S34、利用所述训练集数据进行LSTM模型训练,根据所述适应度函数计算各样本粒子的适应度值,获取所有样本粒子的适应度值,比较样本粒子适应度值的大小,选择其中的最小值作为粒子群适应度值;
S35、对各所述样本粒子进行随机跳变,得到新样本粒子,计算各所述样本粒子和所述新样本粒子的跳变概率,根据所述跳变概率,选择组成新样本粒子群的样本粒子,组成新粒子群;
S36、计算所述新粒子群中各样本粒子的位置和速度,更新相应所述样本粒子的空间位置最小值和所述新粒子群的空间位置最小值;
S37、判断迭代次数是否到达最大迭代次数,如果未到达,则重复执行S34,如果到达,则更新当前温度T,更新后的当前温度T'=0.99*T,判断所述更新后的当前温度T'是否大于预设的结束温度,如果是则执行步骤S32,否则降温结束,并保存最优个体;
S38、根据获得的所述最优样本粒子,得到LSTM网络的各项参数,建立优化后的LSTM模型。
5.根据权利要求3所述的基于改进LSTM的PM2.5数据异常值检测方法,其特征在于:所述S31模拟退火粒子群算法中的参数包括粒子群规模、最大迭代次数、加速度因子、惯性权重、各样本粒子的初始速度和初始位置。
6.根据权利要求3所述的基于改进LSTM的PM2.5数据异常值检测方法,其特征在于:所述步骤S33中适应度函数即所述LSTM模型的损失函数,所述适应度函数为:
式中,Fit为适应度,n为训练的样本数量,m为预设的最大迭代次数,di为第i个样本粒子的PM2.5实际值,tq为第q次迭代的预测PM2.5输出值,为实际的PM2.5均值,为预测输出的PM2.5均值。
7.根据权利要求3所述的基于改进LSTM的PM2.5数据异常值检测方法,其特征在于:所述步骤S35中采用Metropolis准则计算跳变概率,具体方法为:
式中,P1为跳变概率,k为玻尔兹曼常数,f(·)为适应度值,xnew(j)新粒子群中第j个个体,xold(j)为跳变前粒子群中第j个个体,ξ为预设的常数,T为当前温度。
8.根据权利要求3所述的基于改进LSTM的PM2.5数据异常值检测方法,其特征在于:所述步骤S36更新样本粒子速度的计算方法为:
Viq+1=ωViq+c1r1(Pi-Siq)+c2r2(Pg-Siq)
式中,Siq为第q次迭代第i个粒子在空间中的位置,Viq为第q次迭代第i个粒子在空间中的速度,Pi为第i个粒子的空间位置最小值,Pg为粒子群的空间位置最小值,ω为惯性权重,q为当前迭代次数,c1和c2为加速度因子,r1和r2为[0,1]之间的随机数;
所述更新样本粒子位置的方法为:Siq+1=Siq+Viq+1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华理工大学,未经东华理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011333748.5/1.html,转载请声明来源钻瓜专利网。