[发明专利]基于集成高斯过程回归的有杆泵抽油井动液面软测量方法有效
申请号: | 201910762684.1 | 申请日: | 2019-08-19 |
公开(公告)号: | CN110472689B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 高宪文;赵荣昌;王明顺;张逸帆 | 申请(专利权)人: | 东北大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明提供一种基于集成高斯过程回归的有杆泵抽油井动液面软测量方法,涉及油田软测量技术领域。本方法为:采集数据;将数据归一化后得到训练集和测试集;设置分类个数k,根据模糊C均值聚类算法得到训练集T的k个聚类划分后的训练样本集T′;依次求取训练样本集中每个子集的平均值,根据平均值获得k个簇的中心点;对每个训练样本子集建立高斯过程回归动液面预测模型;将测试样本集中x |
||
搜索关键词: | 基于 集成 过程 回归 有杆泵抽 油井 液面 测量方法 | ||
【主权项】:
1.一种基于集成高斯过程回归的有杆泵抽油井动液面软测量方法,其特征在于:包括如下步骤:/n步骤1:采集有杆泵抽油井的井口套压、日产液量、含水率、产气量、抽油机示功图数据、冲次时间及实测动液面高度数据;计算得到下冲程平均载荷、日产油量、日产水量和冲次;对井口套压、日产油量、日产水量、产气量、下冲程平均载荷和冲次进行归一化处理,得到初始样本集S;将初始样本集S分为训练集T={(x1,y1),(x2,y2),…,(xi,yi),…,(xE,yE)}和测试集M={(x1,y1),(x2,y2),…,(xq,yq),…,(xB,yB)};其中, 代表集合X中第α个d维输入变量,所述输入变量即油井辅助变量,其中,X={T,M},α代表集合X内的数据编号; 代表集合X中第α个与油井辅助变量相对应的实测动液面值;/n步骤2:设置分类个数k,根据模糊C均值聚类算法对训练集T进行划分,得到k个聚类划分后的训练样本集T′={TD1,TD2,…,TDj,…,TDk},其中TDj代表训练样本集内第j簇训练样本子集;/n具体方法为:/n聚类中心矩阵集合V=[v1,v2,...,vj,...,vk]迭代公式如下:/n /n其中,vj代表第j个样本子集的聚类中心矩阵,uj(xi)代表第i个样本对于第j簇的隶属度,b为隶属度矩阵指数,b≥1;/n隶属度矩阵U=[u1(xi),u2(xi),...,uj(xi)...,uk(xi)]的迭代公式为:/n /n且uj(xi)满足以下约束条件:/n /n其中,uj(xi)∈[0,1];/n根据隶属度矩阵U将样本xi归入隶属度值最大的一簇中,令i=i+1重复本步骤,直至完成训练集T的划分,得到k个聚类划分后的训练样本集T′;/n步骤3:依次求取训练样本集T′中每个子集的平均值,根据每个子集的平均值获得k个簇的中心点C1,C2,…,Cj,…,Ck;/n第j簇中心点Cj的计算公式为:/n /n其中sum_feature(j)表示簇j中所有样本点的特征和,sum_number(j)表示簇j中所有样本的数目;/n步骤4:对聚类划分后的k个训练样本子集{TD1},{TD2},…,{TDj},…,{TDk}分别采用Bagging算法建立高斯过程回归动液面预测模型;/n具体步骤为:/n步骤4.1:确定Bagging集成学习算法的基学习器个数N,根据Bootstrapping算法对训练样本子集{TDj}进行N轮重取样,获得有差异的Bagging训练集Dj={Dj1,Dj2,…,Djn,…,DjN};/n步骤4.2:依次求取N个Bagging训练子集{Dj1},{Dj2},…,{Djn},…,{DjN}每个簇的平均值,获得N个Bagging训练子集的中心点Cj1,Cj2,…、Cjn,…,CjN,其中Cjn表示第j簇样本子集在进行第n轮Bootstrapping重取样后获得Bagging训练子集{Djn}的中心点;/n中心点Cjn计算公式为:/n /n其中sum_featurej(n)表示簇{Djn}中所有样本点的特征和,sum_numberj(n)表示簇{Djn}中所有样本的数目;/n步骤4.3:使用平方指数函数作为高斯过程回归的协方差函数,建立Bagging训练集Dj的N个高斯过程回归动液面预测模型;/n建立训练集Dj中第n个高斯过程回归动液面预测模型,具体步骤如下:/n获取Bagging训练子集{Djn}={(xp,yp)|p=1,2,...,H},其中,xp∈Rd是d维输入变量即辅助变量的值,xp作为高斯过程回归动液面预测模型输入数据,yp是与xp相对应的动液面值,yp作为高斯过程回归动液面预测模型输出数据;H表示{Djn}中样本的个数;高斯过程为:/nf(x)~GP(m(x),k(xp,xφ))/n其中f(x)为Rd→R隐函数,GP(*)表示高斯过程,k(xp,xφ)为协方差函数,xp和xφ是Bagging训练子集Djn内的d维输入变量即辅助变量,m(x)为均值函数,取值为0;/n将噪声ε考虑到观测目标值y=[y1,y2,...,yq,...,yH]T时,可建立高斯过程回归模型,如下所示:/ny=f(x)+ε/n其中ε为与f(x)不相关的独立高斯白噪声,ε服从均值为0、方差为σd2的正态分布;/n高斯回归过程选用平方指数协方差函数,表示如下:/n /n其中M=diag(l2),l为方差尺度,σf2为信号方差;θ={M,σf2,σd2}为超参数;/n步骤4.4:建立训练样本条件概率的负对数似然函数L(θ)/n /n其中θ为超参数,y=[y1,y2,...,yq,...,yH]T,C=k+σd2Id,k为协方差函数,σd2为方差,Id是d阶单位矩阵,log(*)表示取对数,det(C)为C的行列式,d为输入变量的维数,对L(θ)求偏导数,使用共轭梯度法对步骤4.3中建立的N个高斯回归模型中的超参数θ进行优化;/n步骤4.5:令j=j+1,重复步骤4.1至步骤4.4,直至将训练样本集T′中的所有训练样本子集都得到优化超参数后的N个高斯过程回归动液面预测模型;/n步骤5:将测试样本集M={(x1,y1),(x2,y2),…,(xq,yq),…,(xB,yB)}中xq作为高斯过程回归动液面预测模型的输入,计算出xq与步骤3中k个簇的中心点的欧氏距离,将与xq欧氏距离最小的第w簇作为xq的归属簇,通过步骤4.3中第w簇建立的N个高斯过程回归动液面预测模型得到动液面预测结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910762684.1/,转载请声明来源钻瓜专利网。