[发明专利]基于随机森林回归的地层压力预测方法在审
申请号: | 202110029157.7 | 申请日: | 2021-01-11 |
公开(公告)号: | CN114757085A | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 王树华;谭绍泉;王千军;郝志伟;张建华;钱焕菊;时秀朋;吴微;杨国杰;马骥 | 申请(专利权)人: | 中国石油化工股份有限公司;中国石油化工股份有限公司胜利油田分公司勘探开发研究院 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G01V1/30;G06F119/14 |
代理公司: | 济南日新专利代理事务所(普通合伙) 37224 | 代理人: | 刘亚宁 |
地址: | 257000 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 森林 回归 地层 压力 预测 方法 | ||
1.基于随机森林回归的地层压力预测方法,其特征在于,其包括以下步骤:
步骤1,计算地震层速度及各类地震属性,将计算结果转换到深度域,提取井点地震层速度曲线及各类地震属性曲线;
步骤2,构建地震层速度及多地震属性标签样本库;
步骤3,基于随机森林的样本训练,建立特征矩阵,样本参数优化;
步骤4,构建随机森林回归决策树,利用学习结果预测得到研究区的地层压力数据体。
2.根据权利要求1所述方法,其特征在于,在步骤1中,计算地震属性的种类包括均方根振幅、绝对振幅、反射强度、振幅包络、瞬时振幅、瞬时频率、响应频率、弧长等与地层压力有关的地震属性。
3.根据权利要求1所述方法,其特征在于,在步骤1中,在速度横向变化较大的地区,需建立工区的平均速度场,利用平均速度场进行时深转换;在速度横向变化不大的地区,可利用工区统一的时深曲线进行时深转换;时深转换后,从深度域的地震层深度及各类地震属性数据体中提取出井点处的曲线。
4.根据权利要求1所述方法,其特征在于,在步骤2中,构建地震层速度及多地震属性标签样本库,生成基于少数标准井的包括地震层速度、地震属性类型、深度、幅值及地层压力值的训练数据集,其中标准井选取原则主要为区内钻遇深度大且尽可能涵盖地层及岩性序列发育齐全的井;标准井的地层压力曲线为采用经典方法预测生成的地层压力曲线。
5.根据权利要求1所述方法,其特征在于,在步骤3中,基于随机森林的样本训练,建立特征矩阵,样本参数优化;在样本训练阶段,使用随机重复采样技术从训练样本库中采集多个不同的样本来依次训练多个不同决策树,以地层压力作为因变量,深度、属性及幅值等为自变量做回归分析,设定数的数量,计算特征权重,并不断优化调整随机森林训练参数,来增加最终模型预测结果的鲁棒性和稳定性。
6.根据权利要求5所述方法,其特征在于,某一节点k的特征权重计算公式为
nk=wk*Gk-wleft*Gleft-wright*Gright
其中,Wk,Wleft,Wright分别为节点k以及其左右子节点中训练样本个数与总训练样本数目的比例,Gk,Gleft,Gright分为为节点K以及其左右子节点的不纯度;知道每一个节点的重要性之后,即可通过下式得出某一属性的特征权重:
为了使所有特征权重加起来为1,需要每一特征权重进行标准化,即公式
具体地,训练过程具体步骤如下:
①设训练样本为T={x,y},其中x为地震属性特征值组成的训练数据集合,y为压力预测结果;
②从训练样本T中进行随机采样,生成多个训练集Ti,构建多个决策树Tri;
③从特征值中随机选取部分特征Fj,完成随机森林的构建;
④根据训练样本集和对应的标签数据,优化步骤②、③随机森林中的关键参数,获得地层压力预测模型。
7.根据权利要求1所述方法,其特征在于,在所述步骤4中,构建随机森林回归决策树,利用学习结果预测得到研究区的地层压力数据体;在预测阶段,随机森林将内部多个决策树的预测结果取平均得到最终的结果。
8.根据权利要求7所述方法,其特征在于,在预测阶段,采用的原则是最小均方差,即对于任意划分特征A,对应的任意划分点s两边划分成的数据集D1和D2,求出使D1和D2各自集合的均方差最小,同时D1和D2的均方差之和最小所对应的特征和特征值划分点,其表达式为:
其中,yi是输出值,c1为D1数据集的样本输出均值,c2为D2数据集的样本输出均值。
9.根据权利要求1所述方法,其特征在于,在步骤4中,某一深度地层压力决策树的预测具体步骤如下:
(1)针对某一输入样本,从决策树的根节点起,判断当前节点是否为叶子节点,如果是则返回叶子节点的预测值,如果不是则进入下一步;
(2)根据当前节点的切分变量的和切分值,将样本中对应变量的值与节点的切分值对比;如果样本变量值小于等于当前节点切分值,则访问当前节点的左子节点;如果样本变量值大于当前节点切分值,则访问当前节点的右子节点;
(3)循环步骤2,直到访问到叶子节点,并返回叶子节点的预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油化工股份有限公司;中国石油化工股份有限公司胜利油田分公司勘探开发研究院,未经中国石油化工股份有限公司;中国石油化工股份有限公司胜利油田分公司勘探开发研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110029157.7/1.html,转载请声明来源钻瓜专利网。