[发明专利]基于AdaBoost训练模型的空气质量数据实时校准方法及系统在审
申请号: | 202011504113.7 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112528566A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 王学彬;刘秋明;谢敏;李菁;肖贺 | 申请(专利权)人: | 江西理工大学南昌校区 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06Q10/04;G06Q10/06;G06Q50/26;G06K9/62 |
代理公司: | 北京君恒知识产权代理有限公司 11466 | 代理人: | 张林 |
地址: | 330013 江西省南*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 adaboost 训练 模型 空气质量 数据 实时 校准 方法 系统 | ||
本发明涉及一种基于AdaBoost训练模型的空气质量数据实时校准方法,包括如下步骤:步骤一、初始化AdaBoost训练模型,将国标数据和设备采集的数据导入所述模型中;步骤二、将国标插值数据及设备采集的数据,置入构建好的Boosting模型进行建模;步骤三、采集最新的国标数据以更新校准误差数据,并将更新的误差数据递送给下一次的Boosting模型,再对新的样本数据集不断更新所分配的权重,从而实现气质量数据的实时校准。本发明的方法能够有效的降低设备误差,提高设备的准确率。
技术领域
本发明数据信息技术领域,尤其涉及一种基于AdaBoost训练模型的空气质量数据实时校准方法及系统。
背景技术
近年来,我国对环境问题逐步重视,我国环境污染情形得到进一步改善,但较发达国家而言差距仍为明显。调控空气环境污染的一种效果明显的手段是监测空气环境质量,在工业区,针对空气质量进行实时监测,企业的污染排放量程度可以有效地监控,空气质量环境得到有效地控制。日常上或工业上所使用的电化学气体传感器经过长时间使用会产生一定的零点漂移及量程漂移,而非常规气态污染物(气)浓度变化对传感器存在交叉干扰,以及生态影响和天气因素对传感器产生的影响。但就目前高精度高准确率的空气质量监测站使用的传感器而言成本较大,且实时性较低。传统技术自主研发了一种基于ARM架构的嵌入式设备(以下简称设备),使用了成本和国家监测站相比较低的便携式传感器,能够准实时地监测空气环境质量。但是设备精度和国家监测站相比较低,且准确率不高,存在一定的错误率。
Boosting算法,是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,然后把这些弱分类器集合起来,组成一个更强的最终分类器。在目前直接构造强学习器非常困难的情况下,急需一种有效的学习算法方面的新方法,能够有效地对设备进行校准,提高设备的精度和准确度。
发明内容
本发明的目的是为解决目前空气质量数据准确率和精度较低的问题,进而提供一种基于AdaBoost训练模型迭代更新误差的空气质量数据实时校准方法。
本发明涉及一种基于AdaBoost训练模型的空气质量数据实时校准方法,包括如下步骤:
步骤一、初始化AdaBoost训练模型,将国标数据和设备采集的数据导入所述模型中,利用改进谢别德插值算法对所述国标数据进行处理,得到国标插值数据,国标插值数据的采样频率和分辨率均与设备采集的数据相等;
步骤二、将国标插值数据及设备采集的数据,置入构建好的Boosting模型进行建模;根据上一次Boosting模型中对样本数据集不断更新所分配的权重来进行训练,得到来自最低错误率的分类器的误差数据,将Boosting模型输出的数据进行校准,保留校准值;
步骤三、采集最新的国标数据以更新校准误差数据,并将更新的误差数据递送给下一次的Boosting模型,再对新的样本数据集不断更新所分配的权重,来进行训练出最低错误率的分类器,从而得出新的误差数据,从而实现气质量数据的实时校准。
步骤一中,所述Boosting模型使用基于单层决策树的AdaBoost训练模型,训练数据集输出校准值,单层决策树的训练时间复杂度为O(n*log(n)*d),其中,n为训练集中的样本数,d为数据的维数,d取值为2。
步骤一中,建立AdaBoost训练模型时,利用多次实验得到的全部信息确定模型参数;误差error初始值定为0,将准确率和召回率作为不平衡数据集下度量模型表现的合理标准,每次模型使用的训练数据集大小z为230000条,误差影响率theta在0.4至0.9之间,每次校准数据量m设为15。
步骤一中,利用改进谢别德插值算法对采集的国标数据进行预测,应用最小二乘法求取每个节点的节函数,得到改进谢别德函数,如式(1),(2)所示:
其中的代表的意义如式(2)所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西理工大学南昌校区,未经江西理工大学南昌校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011504113.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种流道膜反应器
- 下一篇:跨语言检索及模型训练方法、装置、设备和存储介质