[发明专利]基于集成高斯过程回归的有杆泵抽油井动液面软测量方法有效

申请号：	201910762684.1	申请日：	2019-08-19
公开（公告）号：	CN110472689B	公开（公告）日：	2022-11-15
发明（设计）人：	高宪文;赵荣昌;王明顺;张逸帆	申请（专利权）人：	东北大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06Q50/06
代理公司：	沈阳东大知识产权代理有限公司 21109	代理人：	李在川
地址：	110819 辽宁***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种基于集成高斯过程回归的有杆泵抽油井动液面软测量方法，涉及油田软测量技术领域。本方法为：采集数据；将数据归一化后得到训练集和测试集；设置分类个数k，根据模糊C均值聚类算法得到训练集T的k个聚类划分后的训练样本集T′；依次求取训练样本集中每个子集的平均值，根据平均值获得k个簇的中心点；对每个训练样本子集建立高斯过程回归动液面预测模型；将测试样本集中xq作为动液面预测模型的输入，计算出xq与k个簇的中心点的欧氏距离，将欧氏距离最小的作为xq的归属簇，建立的N个高斯过程回归动液面预测模型得到动液面预测结果。本方法易于实际工程实现，经济成本低，进一步提高了软测量模型的最终估计精度。
搜索关键词：	基于集成过程回归有杆泵抽油井液面测量方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于集成高斯过程回归的有杆泵抽油井动液面软测量方法，其特征在于：包括如下步骤：/n步骤1：采集有杆泵抽油井的井口套压、日产液量、含水率、产气量、抽油机示功图数据、冲次时间及实测动液面高度数据；计算得到下冲程平均载荷、日产油量、日产水量和冲次；对井口套压、日产油量、日产水量、产气量、下冲程平均载荷和冲次进行归一化处理，得到初始样本集S；将初始样本集S分为训练集T＝{(x₁,y₁)，(x₂,y₂),…,(x_i,y_i),…,(x_E,y_E)}和测试集M＝{(x₁,y₁)，(x₂,y₂),…,(x_q,y_q),…,(x_B,y_B)}；其中，代表集合X中第α个d维输入变量，所述输入变量即油井辅助变量，其中，X＝{T,M}，α代表集合X内的数据编号；代表集合X中第α个与油井辅助变量相对应的实测动液面值；/n步骤2：设置分类个数k，根据模糊C均值聚类算法对训练集T进行划分，得到k个聚类划分后的训练样本集T′＝{TD₁,TD₂,…,TD_j,…,TD_k}，其中TD_j代表训练样本集内第j簇训练样本子集；/n具体方法为：/n聚类中心矩阵集合V＝[v₁，v₂，...，v_j，...，v_k]迭代公式如下：/n /n其中，v_j代表第j个样本子集的聚类中心矩阵，u_j(x_i)代表第i个样本对于第j簇的隶属度，b为隶属度矩阵指数，b≥1；/n隶属度矩阵U＝[u₁(x_i)，u₂(x_i)，...，u_j(x_i)...，u_k(x_i)]的迭代公式为：/n /n且u_j(x_i)满足以下约束条件：/n /n其中，u_j(x_i)∈[0，1]；/n根据隶属度矩阵U将样本x_i归入隶属度值最大的一簇中，令i＝i+1重复本步骤，直至完成训练集T的划分，得到k个聚类划分后的训练样本集T′；/n步骤3：依次求取训练样本集T′中每个子集的平均值，根据每个子集的平均值获得k个簇的中心点C₁，C₂，…，C_j，…，C_k；/n第j簇中心点C_j的计算公式为：/n /n其中sum_feature(j)表示簇j中所有样本点的特征和，sum_number(j)表示簇j中所有样本的数目；/n步骤4：对聚类划分后的k个训练样本子集{TD₁}，{TD₂}，…，{TD_j}，…，{TD_k}分别采用Bagging算法建立高斯过程回归动液面预测模型；/n具体步骤为：/n步骤4.1：确定Bagging集成学习算法的基学习器个数N，根据Bootstrapping算法对训练样本子集{TD_j}进行N轮重取样，获得有差异的Bagging训练集D_j＝{D_j1，D_j2，…，D_jn，…，D_jN}；/n步骤4.2：依次求取N个Bagging训练子集{D_j1}，{D_j2}，…，{D_jn}，…，{D_jN}每个簇的平均值，获得N个Bagging训练子集的中心点C_j1，C_j2，…、C_jn，…，C_jN,其中C_jn表示第j簇样本子集在进行第n轮Bootstrapping重取样后获得Bagging训练子集{D_jn}的中心点；/n中心点C_jn计算公式为：/n /n其中sum_featurej(n)表示簇{D_jn}中所有样本点的特征和，sum_numberj(n)表示簇{D_jn}中所有样本的数目；/n步骤4.3：使用平方指数函数作为高斯过程回归的协方差函数，建立Bagging训练集D_j的N个高斯过程回归动液面预测模型；/n建立训练集D_j中第n个高斯过程回归动液面预测模型，具体步骤如下：/n获取Bagging训练子集{D_jn}＝{(x_p，y_p)|p＝1，2，...，H}，其中，x_p∈R^d是d维输入变量即辅助变量的值，x_p作为高斯过程回归动液面预测模型输入数据，y_p是与x_p相对应的动液面值，y_p作为高斯过程回归动液面预测模型输出数据；H表示{D_jn}中样本的个数；高斯过程为：/nf(x)～GP(m(x)，k(x_p，x_φ))/n其中f(x)为R^d→R隐函数，GP(*)表示高斯过程，k(x_p，x_φ)为协方差函数，x_p和x_φ是Bagging训练子集D_jn内的d维输入变量即辅助变量，m(x)为均值函数，取值为0；/n将噪声ε考虑到观测目标值y＝[y₁，y₂，...，y_q，...，y_H]^T时，可建立高斯过程回归模型，如下所示：/ny＝f(x)+ε/n其中ε为与f(x)不相关的独立高斯白噪声，ε服从均值为0、方差为σ_d²的正态分布；/n高斯回归过程选用平方指数协方差函数，表示如下：/n /n其中M＝diag(l²)，l为方差尺度，σ_f²为信号方差；θ＝{M，σ_f²，σ_d²}为超参数；/n步骤4.4：建立训练样本条件概率的负对数似然函数L(θ)/n /n其中θ为超参数，y＝[y₁，y₂，...，y_q，...，y_H]^T，C＝k+σ_d²I_d，k为协方差函数，σ_d²为方差，I_d是d阶单位矩阵，log(*)表示取对数，det(C)为C的行列式，d为输入变量的维数，对L(θ)求偏导数，使用共轭梯度法对步骤4.3中建立的N个高斯回归模型中的超参数θ进行优化；/n步骤4.5：令j＝j+1，重复步骤4.1至步骤4.4，直至将训练样本集T′中的所有训练样本子集都得到优化超参数后的N个高斯过程回归动液面预测模型；/n步骤5：将测试样本集M＝{(x₁,y₁)，(x₂,y₂),…,(x_q,y_q),…,(x_B,y_B)}中x_q作为高斯过程回归动液面预测模型的输入，计算出x_q与步骤3中k个簇的中心点的欧氏距离，将与x_q欧氏距离最小的第w簇作为x_q的归属簇，通过步骤4.3中第w簇建立的N个高斯过程回归动液面预测模型得到动液面预测结果。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东北大学，未经东北大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910762684.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于集成高斯过程回归的有杆泵抽油井动液面软测量方法有效

专利文献下载