[发明专利]基于随机森林的致密砂岩气储层质量主控因素定量评价方法在审
申请号: | 202110599248.4 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113344359A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 甄艳;康锦涛;赵晓明;葛家旺;周雪松;代茂林 | 申请(专利权)人: | 西南石油大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06;G01V9/00;G06N20/00 |
代理公司: | 成都其知创新专利代理事务所(普通合伙) 51326 | 代理人: | 房立普 |
地址: | 610500 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 森林 致密 砂岩 气储层 质量 主控 因素 定量 评价 方法 | ||
1.一种基于随机森林的致密砂岩气储层质量主控因素定量评价方法,其特征在于,包括以下步骤:
S1:收集研究区影响储层质量的相关影响因素,并根据所述影响因素的参数类型进行参数处理:
若所述影响因素为数据类参数,则检查所述数据类参数是否有缺失,若某一数据类参数有缺失,则去除同一批次的所有影响因素;若无缺失,则保留;
若所述影响因素为文本类参数,则对所述文本类参数进行赋值处理;
S2:将处理后的参数保存为逗号分隔值文件;
S3:以储层质量的表征参数作为储层质量分析的因变量,以所述影响因素作为储层质量分析的自变量;
S4:根据所述因变量和所述自变量,利用随机森林算法,采用有放回的随机抽样方式抽取训练数据,构建决策树和随机森林;
S5:针对各影响因素,计算所述决策树的袋外数据误差,根据所述袋外数据误差优选出主控影响因素。
2.根据权利要求1所述的基于随机森林的致密砂岩气储层质量主控因素定量评价方法,其特征在于,步骤S1中,所述相关影响因素包括沉积类影响因素、成岩类影响因素、以及构造类影响因素。
3.根据权利要求2所述的基于随机森林的致密砂岩气储层质量主控因素定量评价方法,其特征在于,所述沉积类影响因素包括粒度岩性类型、矿物岩性类型、分选性、磨圆度、各类粒度参数、不同类型矿物颗粒含量、杂基含量、原生孔含量;所述成岩类影响因素包括胶结作用类型、不同类型胶结物含量、不同类型溶孔含量、不同类型交代矿物含量、压实强度;所述构造类影响因素包括裂缝类型、不同类型裂缝含量。
4.根据权利要求1所述的基于随机森林的致密砂岩气储层质量主控因素定量评价方法,其特征在于,步骤S3中,所述储层质量的表征参数采用流动单元指数。
5.根据权利要求1所述的基于随机森林的致密砂岩气储层质量主控因素定量评价方法,其特征在于,步骤S4具体包括以下子步骤:
S41:利用随机森林算法,将处理后的数据集作为输入样本数据集,采用有放回的方式,从中随机抽取多次构成一个子集数据,抽样次数与样本数量保持一致,抽样获得的子集数据用于构建一棵决策树;
S42:在子数据集中随机抽取部分影响因素构成候选分割集,按照节点不纯度最小原则从候选分割集中选取一个影响因素作为决策树的分割点,采用该原则继续分裂,直到该节点的所有样本都达到叶子节点,结束分裂;
S43:重复步骤S41和步骤S42建立多棵决策树,由所述多棵决策树构成所述随机森林。
6.根据权利要求1所述的基于随机森林的致密砂岩气储层质量主控因素定量评价方法,其特征在于,步骤S5具体包括以下子步骤:
S51:将袋外数据中的各影响因素放入构建的随机森林中,针对某一决策树,通过所述随机森林计算得到各袋外数据的预测值;
S52:计算各袋外数据的预测值与真实值间的均方误差一;
S53:在所述袋外数据中,选择某一影响因素,对其随机加入噪声后再放入所述随机森林中,计算得到加入噪声后的预测值;计算该影响因素有噪声的预测值与真实值间的均方误差二;
S54:根据该影响因素的均方误差一和均方误差二的大小判断该影响因素的重要性:
若加入随机噪声后,所述均方误差二大于所述均方误差一,且两者之间的差值大于阈值,则该影响因素重要,反之则不重要;
S55:重复步骤S53和步骤S54,对袋外数据中剩下的所有影响因素进行判断;
S56:针对随机森林中剩下的每棵决策树,重复步骤S51和步骤S55,计算每个影响因素的袋外数据误差,并取其平均值作为每个影响因素的重要性值,按平均值的大小降序排列,排序靠前的影响因素即为影响储层质量的主控因素。
7.根据权利要求1-6中任意一项所述的基于随机森林的致密砂岩气储层质量主控因素定量评价方法,其特征在于,还包括以下步骤:
S6:根据所述袋外数据误差优选出的主控影响因素,重新构建决策树和随机森林;
S7:计算各优选的主控影响因素的袋外数据误差,并取各主控影响因素袋外数据误差的平均值作为每个主控影响因素的重要性值;
S8:计算各个优选的主控影响因素的重要性值占所有优选的主控因素重要性值的百分比,以其定量表征各主控影响因素对储层质量的影响程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学,未经西南石油大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110599248.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理