[发明专利]基于地统计加权随机森林的地球化学变量空间预测方法有效
申请号: | 202111483212.6 | 申请日: | 2021-12-07 |
公开(公告)号: | CN114139819B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 王健 | 申请(专利权)人: | 成都理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F18/2431;G06F18/214;G06N5/01;G06F17/18;G06F17/12 |
代理公司: | 成都四合天行知识产权代理有限公司 51274 | 代理人: | 郭受刚 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 统计 加权 随机 森林 地球化学 变量 空间 预测 方法 | ||
1.基于地统计加权随机森林的地球化学变量空间预测方法,其特征在于,包括以下步骤:
S1、获取训练随机森林模型所需的训练数据,所述训练数据包括输入变量和模型输出变量,输入变量包括地质要素和遥感要素,地质要素包括从区域地质数据提取的岩性类别数据和从区域地质数据提取的线环构造矢量数据转换的断裂密度,遥感要素包括地形坡度和植被覆盖度,模型输出变量为已知地球化学元素含量观测数据;其中,输入变量和输出变量采用栅格格式存储;
S2、根据输入变量与已知地球化学元素含量观测数据之间的相关系数及输入变量之间的相关性筛选输入变量作为预测因子,将已知地球化学元素含量观测数据与预测因子作为训练样本;
S3、基于训练样本训练随机森林模型,并采用训练好的随机森林模型对待预测位置的地球化学元素含量进行预测;
所述步骤S3包括以下步骤:
S31、定义模拟栅格图层和滑动窗口半径序列,以及确定随机森林模型中决策树的数目和决策树节点划分时属性的数目;
S32、按照从左到右,从上到下的顺序遍历栅格单元,对于当前需预测地球化学元素含量值的栅格位置,利用紧凑度指数确定最佳滑动窗口半径;
S33、计算空间邻域观测点的空间权重:提取最佳窗口内的训练样本,通过全局变差函数模型和克立格方程组求解训练样本的权重;
S34、训练地统计加权随机森林模型:采用地统计加权的均方根误差函数作为改进的目标函数,训练随机森林回归模型;
S35、预测地球化学元素含量未知点处的取值:将待预测位置s处的预测因子值输入步骤S34训练好的随机森林模型,预测地球化学元素含量值;
S36、重复步骤S32~步骤S35,遍历结束即得完整的地球化学元素含量空间分布图;
所述步骤S31中定义滑动窗口半径序列为ε1≤ε2≤…εT,滑动窗口采用方形窗口,当窗口半径为εt(1≤t≤T)时,滑动窗口的大小为(2εt+1)×(2εt+1);
所述步骤S32中利用紧凑度指数确定最佳滑动窗口半径包括以下步骤:
对于当前需预测地球化学元素含量值的栅格位置s,计算滑动窗口半径为εt时的紧凑度指数,紧凑度指数计算公式如下:
其中,Ct代表落入半径为εt窗口内的地球化学观测样本集合,Nt是样本数目,Yj′和Yk′代表地球化学样本;若相邻两个窗口内样本几乎来自同一个统计分布总体,则Dt和Dt+1差别不大;若样本明显来自两个不同统计总体,则Di和Di+1在整个变化趋势中会出现突变,计算相邻紧凑度指数Dt(t=1,2,…T)之差Dt+1-Dt,设差值最大时滑动窗口对应的半径为εt,则优选出的最佳半径为ε*(s)=εt;
所述步骤S33计算空间邻域观测点的空间权重包括以下步骤:
获取位置s处最佳窗口内的训练样本
{(X1(sl′),X2(sl′),…,XK(sl′);Y(sl′)),l′=1,2,…L′}(L′L),计算各个样本所处位置sl′(l′=1,2,…l′)与位置s的欧氏距离,计算公式为:
将计算得到的欧氏距离代入利用全局样本拟合的变差函数模型γ(h);
求解克立格方程组,公式为:
上式共包含L′+1个方程,式中未知数为λl′(l′=1,2,…L′)和μ共L′+1个,其中μ为拉格朗日算子,求解该方程组得到的λl′即为邻域观测点的权重;
所述步骤S34训练地统计加权随机森林模型包括以下步骤:
对于每个回归决策树,采用改进的目标损失函数进行训练,公式为:
其中,
X代表构建决策树的切分属性或因子,v代表构建决策树相应属性的切分点,Yleft和Yright分别代表左子节点和右子节点所包含的地球化学观测样本点取值集合,Ya和Yb分别代表左右子节点集合中的样本值,Nleft和Nright分别代表左子节点和右子节点中观测样本的数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都理工大学,未经成都理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111483212.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理