[发明专利]一种基于多阈值Birch聚类的相控孔隙度预测方法有效
申请号: | 201910548338.3 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110443271B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 孙歧峰;杜承泽;段友祥;柳璠 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阈值 birch 孔隙 预测 方法 | ||
1.一种基于多阈值Birch聚类的相控孔隙度预测方法,其特征在于,包括以下步骤:
S1:对所有数据进行归一化处理,使各指标处于同一数量级;
S2:初始化M-Birch聚类模型,即主要初始化聚类特征CF和聚类特征树CF Tree,具体过程如下:
假设在某个簇中存在N个d维的阻抗样本{Xi},i=1,2,…,N,将聚类特征CF定义为四元组:CF=N,LS,SS,T,其中,N为簇中阻抗样本的数量,LS为N个阻抗样本的线性和SS为N个阻抗样本的平方和T为簇半径阈值;分支因子是CF Tree的参数;其中,B是树中每个非叶节点最多包含的孩子节点的数量,记为条目CFi,CHILDi,i=1,2,…,B,CFi是该节点中第i个聚类特征,CHILDi指向该节点中的第i个孩子节点;采用启发式设定阈值的方法为M-Birch聚类设定初始阈值,即在整个数据集中随机选取N对样本,将每一个样本都作为一个簇,根据簇的CF条目计算簇之间的曼哈顿距离,距离公式为:然后计算出距离的期望EX和方差DX,计算得出初始阈值T;其中P为预先设定的百分比;计算初始阈值T后,就可以建立一棵初始CF Tree;
S3:动态构建CF Tree,具体步骤如下:
S31:从根节点开始递归向下,通过计算CF与插入节点包含的各条目中CF的距离,寻找距离最短的路径及叶节点;
S32:如果CF与该叶节点各条目中的CF之间的距离小于阈值T,则选择阈值最小的条目,用合并算法将CF与该条目的CF进行合并,并自下向上相应地修改各节点的条目;合并定理如下:假定将n个簇合并,合并后新簇W的聚类特征如下所示:
其中,Ci.mean表示簇Ci的质心,W.mean表示新簇W的质心,计算公式为:
S33:如果CF无法与该条目的CF合并,则判断该条目所在叶节点的CF数量是否小于L;若小于则将CF新建为一个条目,并按B+树的插入算法将该条目插入到距离最近的条目后面,并相应修改CF Tree的结构;否则分裂该叶节点,原则是以距离最远的两个条目为种子进行分裂,剩余的条目按照距离最近合并到这两个条目中,并更新整个CF Tree;
S4:当CF Tree构建完成后,使用凝聚法对CF进行全局聚类;
S5:在沉积相带约束下,训练岭回归预测模型;
S6:在得到最优参数估计量的基础上,由未标签阻抗数据计算得到孔隙度预测值。
2.根据权利要求1所述的一种基于多阈值Birch聚类的相控孔隙度预测方法,其特征在于:在S1中,归一化处理就是将有量纲的表达式变换为无量纲的表达式,使各指标处于同一数量级,以适合进行综合对比评价。
3.根据权利要求1所述的一种基于多阈值Birch聚类的相控孔隙度预测方法,其特征在于:在S1中,使用标准分数归一法,使处理的数据符合均值为0,标准差为1的标准正态分布,其计算公式为:其中X是数据样本,μ为数据样本的均值,σ为数据样本的标准差。
4.根据权利要求1所述的一种基于多阈值Birch聚类的相控孔隙度预测方法,其特征在于:在S3中,动态构建CFTree的过程也就是将簇的聚类特征CF插入到CFTree的过程。
5.根据权利要求1所述的一种基于多阈值Birch聚类的相控孔隙度预测方法,其特征在于:在S4中,全局聚类的具体操作为将每个阻抗样本都作为一个独立的簇,并重复以下过程,计算两两簇之间的距离,找出距离最小的两个簇c1和c2并合并为一个簇,直到达到聚类数目。
6.根据权利要求1所述的一种基于多阈值Birch聚类的相控孔隙度预测方法,其特征在于:在S5中,训练岭回归预测模型时,其参数估计量见公式:其中X为阻抗样本,y为已知的孔隙度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910548338.3/1.html,转载请声明来源钻瓜专利网。