[发明专利]一种基于聚类的ARIMA算法的气体浓度预测方法在审
申请号: | 202111444922.8 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114386228A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 刘杰强;严明;武子科;崔健;艾婷;崔玉妹;邢景仪;李文奎;彭帅 | 申请(专利权)人: | 北京东方计量测试研究所 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06K9/62;G01N33/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100086 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 arima 算法 气体 浓度 预测 方法 | ||
本申请为一种基于聚类的ARIMA算法的气体浓度预测方法,提供了一种气体浓度预测方法,包括:S1:采集气体浓度数据,所述气体浓度数据为气体实时浓度序列;S2:数据预处理,基于K‑Means聚类算法对气体浓度数据进行离群点检测,以剔除异常数据;S3:利用ARIMA算法建立ARIMA预测模型;S4:将预处理后的气体浓度数据输入ARIMA预测模型中,以进行气体浓度预测。
技术领域
本申请涉及一种基于聚类的ARIMA算法的气体浓度预测方法。
背景技术
工业原料在车间长期储存的过程中,存在诸多不安全因素。工业原料的添加、转运、长期储存的过程中很难避免泄漏情况的发生,并且这些气体常常伴随着剧毒、易燃、易爆等特点,一旦泄漏事故发生,后果不堪设想,不仅严重影响工程进度,甚至危害人员的生命财产安全。且该问题的维护与管理成本较高,难度较大。基于此,气体泄漏情况、扩散状态等情况,需要通过及时有效地对环境参数信号实时监测来判断评估,实现预防为主、及早发现、有序处置。
对于气体泄漏情况的预警,可以将气体浓度序列抽象为单变量时间序列。ARIMA模型(差分整合自回归滑动平均模型)作为常用的时间序列预测模型,具有轻量、易于实现、准确率高且易于配置等特点。但是,传统的ARIMA模型只能预测趋势,对于输入信号的噪声控制存在一定的局限性,进而影响到输出结果的预测准确度。实际应用中,研究院、高校、企业等单位根据应用场景的不同,通过对ARIMA模型进行必要的改进,实现时间序列的预测。
发明内容
鉴于上述的情况,本申请提供一种能解决上述问题的低噪声、高精度、轻量化及参数可灵活配置的气体浓度预测方法,具体而言本发明提供一种基于聚类的ARIMA算法的气体浓度预测方法,基于K-Means聚类算法剔除异常数据,并利用ARIMA算法建模进行浓度预测、输出结果。
本申请的至少一个目的在于提供一种气体浓度预测方法,包括:
S1:采集气体浓度数据,所述气体浓度数据为气体实时浓度序列;
S2:数据预处理,基于K-Means聚类算法对气体浓度数据进行离群点检测,以剔除异常数据;
S3:利用ARIMA算法建立ARIMA预测模型;
S4:将预处理后的气体浓度数据输入ARIMA预测模型中,以进行气体浓度预测。
根据本申请的一个实施例,其中,在数据预处理之前,还包括数据清洗步骤,在数据清洗步骤中,将存在缺失值的数据进行处理,选择用缺失值邻近的数值取平均作为替代,来填充缺失值。
根据本申请的一个实施例,其中,数据预处理步骤包括:
a.将气体浓度数据按数据量分为K个类别,选择K个类别对应的K个初始中心点;
b.对任一样本点,在每一轮的迭代中,求取该样本点到K个中心点的欧式距离,然后,将样本点归入距其最近的中心点所对应的类别;
c.通过求各类期望值点对K个中心点进行迭代,对各类别的中心点取平均,更新中心点;
d.对每一个聚类中心点,重复b、c两个步骤,当各个类别的中心点的移动距离符合某一阈值要求时,迭代结束,分类任务完成。
根据本申请的一个实施例,其中,当各个类别的中心点的移动距离大于一设定值时,迭代结束,分类任务完成。
根据本申请的一个实施例,其中,选择K个类别对应的K个初始中心点的方法包括:
遍历所有样本点对求距离,选择其中距离最远的两个点;
当初始中心点达到K个,则终止,否则,在余下样本中,选一个样本C3,挑选该样本点的目标为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京东方计量测试研究所,未经北京东方计量测试研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111444922.8/2.html,转载请声明来源钻瓜专利网。