[发明专利]一种基于随机森林回归的声波曲线生成方法有效
申请号: | 201910556061.9 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110344824B | 公开(公告)日: | 2023-02-10 |
发明(设计)人: | 师素珍;谷剑英;郭家成;刘中元;冯健;冯国旭;李明轩 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | E21B49/00 | 分类号: | E21B49/00;E21B47/00 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 李冉 |
地址: | 100000 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 回归 声波 曲线 生成 方法 | ||
1.一种基于随机森林回归的声波曲线生成方法,其特征在于,包括如下具体步骤:
步骤一:收集研究区及研究区周围全部测井资料;
步骤二:选取资料齐全的测井,对其数据进行归一化处理,得到样本数据;
步骤三:将样本数据运用主成分分析法,筛选特征值对应的特征向量组建成数据集;
步骤四:将筛选后的样本数据按照固定比例,运用bootstrap方法从样本数据中有放回的抽取数据,分为训练数据集和测试样本集;
步骤五:构建基于随机森林回归算法的曲线生成模型;
步骤六:将待生成处测井的数据集输入构建好的模型得到缺失的测井曲线;
样本数据划分过程中,选择样本数据的80%作为训练样本集,20%作为测试样本集;
所述步骤五中,具体的步骤包括:
S51:将训练数据集D作为输入;
S52:训练数据集位于的输入空间内,将每个区域递归地划分成两个子区域并且决定在每个子区域内的输出值,从而创建二叉决策树;
S53:对于每个子区域,选用均方误差作为分割效果的评判因子,找到最优的切分变量j和最优的切分点s,并求解
其中,yi表示输出值,ci表示实际值;找到使上式最小化的(j,s);
S54:利用选择的(j,s)进行划分区域然后求取对应的输出值:
R1={x|xj≤s},R2={x|xj>s};其中xj是第j个变量;s为xj的最优切分点值;
为回归树的预测结果;
S55:对两个子区域应用以上S52-S54,直到找到最优的切分变量j和最优的切分点s停止,将输入空间划成M个区域即R1,R2,…,RM,最终生成回归树:
其中I表示当满足条件时I为1,当不满足条件时I为0的函数;对于每个训练数据集,构造一棵决策树,通过组合多棵决策树,构建基于随机森林回归算法的声波曲线模型,模型最终的输出值为所有回归树输出值的均值。
2.根据权利要求1所述的一种基于随机森林回归的声波曲线生成方法,其特征在于,所述步骤一中,所述测井资料包括但不限于:声波曲线,自然伽马曲线、密度曲线、自然电位曲线和视电阻率曲线。
3.根据权利要求1所述的一种基于随机森林回归的声波曲线生成方法,其特征在于,所述步骤二中,所述归一化公式:
其中x为测井数据。
4.根据权利要求1所述的一种基于随机森林回归的声波曲线生成方法,其特征在于,所述步骤三中,具体的步骤包括:将样本数据组成数据矩阵,通过计算数据矩阵的协方差矩阵,然后得到协方差矩阵的特征值特征向量,选择特征值最大的k个特征所对应的特征向量组成的矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910556061.9/1.html,转载请声明来源钻瓜专利网。