[发明专利]一种基于机器学习的修复有机污染土壤的方法有效

专利信息
申请号: 202210713071.0 申请日: 2022-06-22
公开(公告)号: CN115007634B 公开(公告)日: 2022-12-06
发明(设计)人: 陈斌;朱利中 申请(专利权)人: 浙江大学
主分类号: B09C1/08 分类号: B09C1/08
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 邱启旺
地址: 310058 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 机器 学习 修复 有机 污染 土壤 方法
【权利要求书】:

1.一种基于机器学习的修复有机污染土壤的方法,其特征在于,所述方法具体为:先化学氧化预处理有机污染土壤,再利用土著微生物进一步修复有机污染土壤;采集修复有机污染土壤过程中的有机污染土壤类型、氧化剂类型、氧化剂浓度、修复时间、氧化还原电位、总有机碳含量、土壤酸碱度和苯并芘去除率数据;利用十折交叉验证构建XGBoost模型,并进行训练,得到最优的XGBoost模型,通过最优的XGBoost模型协同Eh调控化学氧化耦合微生物修复有机污染土壤;

利用十折交叉验证构建XGBoost模型,并进行训练的过程具体为:建立树的模型、寻找最优分裂点构建得到XGBoost模型,采用十折交叉验证基于训练集训练XGBoost模型,并计算目标函数MSE,采用目标函数MSE对XGBoost模型进行误差评定拟合学习计算,利用决定系数R2和均方根误差RMSE对最优XGBoost模型进行精准度评价;若目标函数MSE的误差评定不是最优的,则继续开展十折交叉验证,直到MSE的误差评定为最优精度,进而训练得到最优的XGBoost模型,并保存最优的XGBoost模型的模型参数;

建立树的模型、寻找最优分裂点构建得到XGBoost模型的过程具体包括以下步骤:

建立树的模型具体为:利用XGBoost算法生成回归树的集合F为:

其中,q为一棵回归树结构的确定法则,即将m维的特征向量xi映射到T个叶子节点的数值,而T个叶子节点数值的权重由T维向量ω指定;f(x)表示某一棵回归树的映射关系,即由特征向量x映射至目标值f(x),Wq(x)为一棵回归树的结构由法则q确定,并将特征向量x映射至目标值Wq(x);

利用树集成的思想将K棵回归树的结果进行求和,作为最终的预测值,数据集合表示为:

其中,数据集合D中样本条目数为n,xi为m维的特征向量,yi为第i个特征向量xi对应的苯并芘去除率,且1≤i≤n;

一条数据样本的回归值由K棵回归树的计算结果的和确定,公式如下:

其中,表示第i个预测苯并芘去除率值,表示映射特征向量xi得到的预测值,fk(xi)表示第k棵回归树对特征向量xi进行映射得到的回归数值,fk表示第k棵回归树的映射关系;

通过XGBoost算法对比使用土壤类型、氧化剂类型、氧化剂浓度、时间、氧化还原电位、TOC和pH在内的不同特征变量的预测苯并芘去除率值与实际值的误差,并根据误差的大小判断不同的特征变量与苯并芘去除率之间的相关程度,获得不同特征变量与苯并芘去除率之间的相关性数值;

训练初始XGBoost模型生成回归树集合时,使用带正则项的目标函数,公式如下:

其中,L(ф)为目标函数,是损失函数,为初始XGBoost回归模型对训练集中第i个特征向量xi进行预测得到的预测苯并芘去除率值,yi为数据样本对应的真实目标值;Ω(f)是正则惩罚项,通过调节系数γ和λ的大小控制生成的K棵回归树的复杂度;fk表示第k棵回归树的映射关系,T表示每棵回归树叶子节点的数量,而||ω||2表示T个叶子节点权重的L2范数,即叶子节点的权重向量ω的欧式距离,如下式所示:

其中,权重向量ω有n个维度,ωi为权重向量ω的第i个维度的取值;

寻找最优分裂点,即基于网格搜索方式设置搜索网格找到最优的回归树数目和树的最大深度,构建得到XGBoost模型的过程具体为:

设置搜索网格为:

生成回归树数目:[1,2,3,...,j-1,j],

回归树最大深度:[1,2,3,...,k-1,k];

其中,最大生成回归树数目为j,最大的回归树深度为k;遍历所有生成回归树数目和回归树最大深度的参数组合,依次选用每一种参数组合,计算在训练集上的苯并芘去除率值,当计算所得的苯并芘去除率值与真实苯并芘去除率值之间的误差最小时,对应的参数组合即为最优解,即获得最优的回归树数目和树的最大深度,即找到最优分裂点,完成了XGBoost模型的构建。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210713071.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top