[发明专利]一种融合时空特征的油藏生产指标机器学习预测方法在审
申请号: | 202310819291.6 | 申请日: | 2023-07-06 |
公开(公告)号: | CN116542429A | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 张凯;付文豪;留云龙;李金轩;刘兴宇;张铭扬;张黎明;刘丕养;严侠;张华清;张文娟;杨永飞;孙海;姚军 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06Q10/063 | 分类号: | G06Q10/063;G06Q50/02;G06N3/044;G06N3/08;G06F18/27 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 王鸣鹤 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 时空 特征 油藏 生产指标 机器 学习 预测 方法 | ||
1.一种融合时空特征的油藏生产指标机器学习预测方法,其特征在于,包括如下步骤:
步骤1、确定待预测的生产指标及生产指标的影响因素,建立油藏生产指标预测样本库;
步骤2、筛选得到油藏生产指标的主控因素;
步骤3、构建循环自编码器,提取动态影响因素的时间序列特征;
步骤4、构建基于极限梯度提升树的油藏生产指标预测模型;
步骤5、使用交叉验证技术评估模型对油藏生产指标的预测效果,然后利用验证效果良好的模型进行油藏生产指标预测。
2.根据权利要求1所述融合时空特征的油藏生产指标机器学习预测方法,其特征在于,所述步骤1的具体过程为:
步骤1.1、对油藏原始数据进行数据清洗;数据清洗包括缺失数据处理及异常值处理;针对缺失数据,直接利用油藏原始数据中与缺失数据为同类数据的均值替代;针对异常值,首先通过箱型图识别异常值,然后利用油藏原始数据中与异常值为同类数据的均值替代;箱型图识别的过程为:首先将数据由小到大排序,然后把数据四等分,划分最小的25%和其余数据的值为下四分位,记作;处于数据中间的值为中位数,记作;划分最大的25%和其余数据的值为上四分位,记作;上四分位和下四分位之差为四分位距,记作;此时,计算得到箱型图的非异常值上限为,及箱型图的非异常值下限为;而处于上限和下限的值被识别为异常值;
步骤1.2、确定待预测的油藏生产指标及生产指标的影响因素;
待预测的油藏生产指标为未来某一时间段的累积产油量和累积产水量;
生产指标的影响因素分为静态影响因素和动态影响因素;静态影响因素为随时间不变或无明显变化的量,包括油层中深、平均有效厚度、平均空气渗透率、渗透率极差、地层原油粘度,这些静态影响因素涵盖了空间特征;动态影响因素为随时间有明显变化的量,包括可采储量采出程度、总油井口数、总水井口数、年产油量、年产水量,这些动态影响因素涵盖了时间序列特征。
3.根据权利要求2所述融合时空特征的油藏生产指标机器学习预测方法,其特征在于,所述步骤2中,分别使用灰色关联度和随机森林对静态影响因素和动态影响因素中的各个影响因素进行定量分析,确定与预测指标高相关的主控因素;具体过程为:
步骤2.1、针对静态影响因素,利用灰色关联度选取影响预测指标的主控因素;
将预测指标视为参考序列,影响预测指标的因素视为比较序列;
采用均值法对影响因素原始数据进行无量纲化处理,具体计算公式如下:
(1);
其中,表示影响因素原始数据中第个序列第个元素值,表示无量纲化处理后第个序列第个元素值;表示序列总个数,表示序列中元素的总个数;
在进行无量纲化处理后,定义一个标准化矩阵,如下所示:
(2);
其中,将矩阵的第0列作为参考序列,将矩阵的第1列到最后一列作为个比较序列;
然后每列比较序列分别减去参考序列,得到一个差值矩阵,如下所示:
(3);
然后分别计算每个比较序列和参考序列对应元素的关联系数,计算公式如下:
(4);
其中,表示对差值矩阵中的每个元素取绝对值,表示对差值矩阵中的每个元素取绝对值后的最小值,表示对差值矩阵中的每个元素取绝对值后的最大值,表示分辨系数;表示无量纲化处理后第0个序列第个元素值,第0个序列为参考序列;
最后,将某个比较序列中各个元素和参考序列中各个元素的灰色关联系数求取均值,得到该比较序列和参考序列的灰色关联度,公式如下:
(5);
其中,表示参考序列的第个元素值与第个序列第个元素值的灰色关联系数;
通过公式(1)到公式(5),分别计算累积产水量和累积产油量与静态影响因素的灰色关联度,预先设置灰色关联度阈值,将高于灰色关联度阈值的静态影响因素作为主控因素;
步骤2.2、针对动态因素,采用随机森林算法筛选主控因素;
将预测指标视为随机森林算法的预测目标;将连续年的动态影响因素视为输入特征,用表示动态影响因素的总个数,因此输入特征的总数为个;通过随机森林算法计算出各个特征的贡献度,并整理成为一个贡献度矩阵:
(6);
其中,表示第个动态影响因素第年的特征贡献度,,;贡献度矩阵中所有元素的总和为1;
而后,将各个动态影响因素所有时间段特征的贡献度求和,得到每个动态影响因素对目标的贡献度,公式如下:
(7);
其中,表示第个动态影响因素对目标的贡献度;
对每个动态影响因素的贡献度按照由高到低的顺序进行排序,选择前5个动态影响因素作为主控因素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310819291.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理