[发明专利]基于XGBOOST算法与特征工程的岩性及流体类型识别方法有效
申请号: | 202010392710.9 | 申请日: | 2020-05-11 |
公开(公告)号: | CN111753871B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 赵峦啸;邹采枫;陈远远;王一戎;陈怀震;张丰收;耿建华 | 申请(专利权)人: | 同济大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F30/27;G06N20/20;G06N3/08;G01V11/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 xgboost 算法 特征 工程 流体 类型 识别 方法 | ||
本发明涉及一种基于XGBOOST算法与特征工程的岩性及流体类型识别方法,包括以下步骤:1)根据钻井或测井数据获取地层的岩性及流体类型标签以及对应的弹性参数数据构建岩性及流体类型‑弹性参数的学习样本;2)特征构造:根据弹性参数利用数学变换构造特征集合;3)特征选择:结合嵌入式特征选择与包裹式特征选择策略,在特征集合中选择最终的输入特征;4)通过XGBOOST算法构建多井岩性和流体识别的机器学习模型进行学习并输出岩性及流体类型识别结果与现有技术相比,本发明具有构造更多对岩性或流体敏感属性、兼顾了表达能力和泛化能力等优点。
技术领域
本发明涉及地球物理领域,尤其是涉及一种基于XGBOOST算法与特征工程的岩性及流体类型识别方法。
背景技术
现有的地震流体识别主要是基于弹性特征(如纵横波速度比)的阈值,或是基于多种弹性参数结合的流体识别因子,这些地震流体识别方法主要适应于孔隙度很高的浅层储层,一方面的孔隙度很高时会放大流体作用,另外一方面浅层储层的流体自身的弹性性质差异很大,但这些单纯基于弹性参数驱动的流体识别用于中深层或复杂岩性油气藏时往往带来很大的不确定性,因为其储层流体类型和弹性特征的映射关系变得模糊起来,且往往受物性参数影响较大。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于XGBOOST算法与特征工程的岩性及流体类型识别方法,用于基于测井数据或地震数据对地质岩性及流体类型空间分布进行预测。
本发明的目的可以通过以下技术方案来实现:
一种基于XGBOOST算法与特征工程的岩性及流体类型识别方法,包括以下步骤:
1)根据钻井或测井数据获取地层的岩性及流体类型标签以及对应的弹性参数数据构建岩性及流体类型-弹性参数的学习样本;
2)特征构造:根据弹性参数利用数学变换构造特征集合;
3)特征选择:结合嵌入式特征选择与包裹式特征选择策略,在特征集合中选择最终的输入特征;
4)通过XGBOOST算法构建多井岩性和流体识别的机器学习模型进行学习并输出岩性及流体类型识别结果。
所述的岩性及流体类型包括泥岩、含水砂岩和含气砂岩,所述的弹性参数包括纵波阻抗IP和横波阻抗IS。
所述的特征集合具体为:
在特征集合中,IP+IS、IP-IS、IP*IS三项属性为纵横波阻抗通过数学运算构造所得,为纵横波阻抗比,IP2-2IS2、IP sin 160°+IS cos 160°均为弹性属性-流体指示因子,为弹性属性泊松比。
所述的步骤3)具体包括以下步骤:
31)在嵌入式特征选择框架下,对所有的测井数据,采用XGBOOST算法对特征的重要性进行排序;
32)在包裹式特征选择框架下,根据排序后的特征构造特征子集,并采用XGBOOST算法进行模型训练和测试,统计岩性及流体类型识别的总体准确率、F1分数以及每种类别对应的F1分数;
33)根据总体准确率、F1分数选择最终的输入特征。
所述的步骤31)中,采用XGBOOST算法对特征的重要性进行排序具体为:
在树的每个分裂节点处,获取对应特征的增益,将特征在所有树的增益加和后除以被选择的次数,即得到该特征重要性的量化值,并按照量化值大小进行排序。
所述的步骤32)中,以纵波阻抗和纵横波速度比构建对照组进行训练和测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010392710.9/2.html,转载请声明来源钻瓜专利网。