[发明专利]一种基于集成学习的油田采收率预测方法在审
申请号: | 202111178615.X | 申请日: | 2021-10-13 |
公开(公告)号: | CN113988382A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 安兴菊;任志勇;杨雪玲;闵小翠 | 申请(专利权)人: | 广州华立科技职业学院;安兴菊 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/02;G06F16/215;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 511325 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 学习 油田 收率 预测 方法 | ||
本发明公开了一种基于集成学习的油田采收率预测方法,其特征在于提取地质因素、开发状况因素等油田历史数据进行采收率标记,形成油田历史初始数据集;采用皮尔逊相关系数计算油田初始数据集中各特征得分,保留前k列特征,构建油田历史最优数据集;根据油田差异性设置多个CART决策树基类预测器,采用线性加权的方式组合各基类预测器,形成油田采收率强预测器,实现油田采收率预测。本发明采用决策树挖掘地质因素、开发状况因素与油田采收率的内在联系,建立适用于油田开发各时期的油田采收率预测器;根据油田间的差异性设置多个基类预测器,以集成学习思想形成油田采收率强预测器,提高油田采收率预测器的预测精度,实现油田采收率的准确预测。
技术领域
本发明属于地球物理勘探领域和人工智能领域,具体涉及一种基于集成学习的油田采收率预测方法。
背景技术
采收率是水驱油田潜力评价的重要组成部分,实现采收率准确预测能够有效地指导油田各阶段的准确部署,制定符合油田实际状况的采收措施。而随着油田开发进入特高含水时期,传统的经验公式法、油藏数值模拟等油田采收率计算方法适应性差、预测结果存在偏差,导致容易出现较大的不确定性范围。采用机器学习方法预测油田采收率,能够充分利用油田开发过程积累的数据,分析各时期的地质状况、开发状况等油田数据与油田采收率的内在联系,建立适用于油田开发各时期的油田采收率预测器,实现油田采收率的准确预测。
针对油田间的地质状况、开发状况等因素的差异显著,单一预测器无法全面反映油田采收率与油田数据之间联系的问题,同时设置多个基类预测器,其中基类预测器的参数结构均不相同,使用集成学习思想训练多个基类预测器并进行集成,提出一种基于集成学习的油田采收率预测方法。
发明内容
为了克服油田在特高含水期阶段,传统油田采收率计算方法适应性差,预测结果不准确的问题,本发明提供了一种基于集成学习的油田采收率预测方法。通过皮尔逊相关系数的特征选择方法优选影响油田采收率的高相关度特征,采用决策树的机器学习方法挖掘各时期的地质状况、开发状况等因素与油田采收率的内在联系,建立适用于油田开发各时期的油田采收率预测器,并根据油田间的差异性设置多个基类预测器,使用集成学习思想训练并集成基类预测器形成强预测器,实现油田采收率的准确预测。
为实现上述目的,本发明技术方案主要包括以下三个步骤:
1.提取与处理油田历史数据:
从油田数据资料库中提取地质因素、开发状况因素、采收率等油田历史数据,采用缺失值填充等数据清洗方法处理油田历史数据,消除油田历史数据存在的缺失值、无效值等数据质量问题。利用数据集成方法就区块、年份的信息对地质因素、开发状况因素等资料数据进行提取合并,并将历史采收率作为标签值,形成油田历史初始数据集。
2.优选采收率高相关度特征
油田历史初始数据集中包含部分与油田采收率预测相关度低的冗余特征和无关特征,会严重油田采收率预测器性能,导致预测器收敛精度低。采用皮尔逊相关系数的特征选择方法,计算各特征与油田采收率的相关度,优选出与油田采收率预测相关度高的特征,提高油田采收率预测器的预测精度。
使用皮尔逊相关系数计算油田初始数据集中各特征得分,记为PScore,PScore越高表示该特征与油田采收率预测相关度越大,根据各特征相关度计算的结果,保留前k列特征(此处k为所有特征个数的一半),构建油田历史最优数据集。
3.基于集成学习预测油田采收率
使用CART决策树的机器学习方法挖掘各油田历史最优数据集的内在规律,建立适用于油田开发各时期的油田采收率预测器。由于油田间的状况复杂、差异显著,使用单一预测器无法全面反映油田采收率与油田数据之间联系,根据油田差异性设置多个基类预测器,以集成学习的思想对多个基类预测器进行集成,采用线性加权方法得到油田采收率强预测器,同时避免采用单一预测器的弊端,得到更合理的油田采收率预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华立科技职业学院;安兴菊,未经广州华立科技职业学院;安兴菊许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111178615.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理