[发明专利]一种基于多视角学习的抽油机井工况识别方法及系统有效
申请号: | 201811463075.8 | 申请日: | 2018-12-03 |
公开(公告)号: | CN109630095B | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 王延江;周斌;刘伟锋;刘宝弟 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | E21B47/009 | 分类号: | E21B47/009;E21B47/06;E21B47/07;G06F17/50 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多视角学习的抽油机井工况识别方法及系统,属于工况诊断技术领域,采用基于大数据生产环境下的多视角学习方法,以实测地面示功图和电功率信号为两个不同的主视角,实测井口温度和井口压力信号为两个辅视角,进行有效组合并利用这四个实测视角,通过少量抽油机井工况数据或结合大量未知工况数据建立工况识别模型,其中,建立的工况识别模型有效集成了Hessian正则化和多视角学习方法,能够充分利用大数据和油气生产物联网环境下有杆泵采油生产系统采集的海量多源实时信息,突破单一信息源识别抽油机井工况的局限性和传统多源信息识别方法的技术瓶颈,从而进一步提高了抽油机井工况识别精准率和工程实用性。 | ||
搜索关键词: | 抽油机井 工况识别 多视角 实测 工况数据 大数据 学习 单一信息源 地面示功图 电功率信号 工程实用性 视角 采油生产 多源信息 工况诊断 技术瓶颈 井口压力 联网环境 生产环境 实时信息 系统采集 有效集成 有效组合 正则化 主视角 多源 井口 油气 | ||
【主权项】:
1.一种基于多视角学习的抽油机井工况识别方法,其特征在于,所述抽油机井工况识别方法包括:构建包含已知抽油机井工况和未知抽油机井工况对应的实测地面示功图、电功率信号、井口温度和井口压力信号四个视角的样本库;以实测地面示功图和电功率信号为主,实测井口温度和井口压力信号为辅,根据实际需求构建主辅视角组合;分别对所构建的主辅视角组合中的每一个视角,根据机理分析、先验信息和专家知识进行特征提取,以构建每一个视角的特征数据样本集;根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,采用多视角学习方法,并有效集成Hessian正则化建立相应的工况识别模型;通过建立的工况识别模型进行抽油机井工况识别;以实测地面示功图和电功率信号为2个主视角,实测井口温度和井口压力信号为2个辅视角,构建主辅视角组合,其中,所述主辅视角组合为第一视角组合、第二视角组合和第三视角组合中的一种,其中,所述第一视角组合包括实测地面示功图和实测电功率信号两个主视角,所述第二视角组合包括实测地面示功图、实测电功率信号和实测井口温度信号三个主辅视角,所述第三视角组合包括实测地面示功图、实测电功率信号、实测井口温度信号和实测井口压力信号四个主辅视角;其中,所述根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,采用多视角学习方法,并有效集成Hessian正则化建立相应的工况识别模型,具体包括:根据所构建的主辅视角组合中的视角个数及用于训练的已知抽油机井工况和未知抽油机井工况对应的特征数据样本个数,确定对应的多视角学习方法,并有效的集成Hessian正则化建立相应的工况识别模型,其中,若构建的为第一视角组合,则采用加权多核学习方法、协同训练学习方法、加权典型相关分析学习方法中的一种多视角学习方法;若构建的为第二视角组合,则采用多视角加权多核学习方法;若构建的为第三视角组合,则采用多视角加权典型相关分析学习方法;所构建的所有种类的工况识别模型是有效选择集成Hessian正则化和多视角学习方法的工况识别模型,其中,有效选择集成Hessian正则化和多视角学习方法建立的工况识别模型在少量已知训练样本下或通过结合大量未知训练样本来更精准地识别抽油机井工况;两个主视角组合的协同训练学习方法与Hessian正则化集成建立的工况识别模型实现在少量已知工况样本下利用大量未知工况样本获取较高的工况识别精准率,两个主视角组合的加权典型相关分析学习方法和四个主辅视角组合的多视角加权典型相关分析学习方法与Hessian正则化集成建立的工况识别模型实现在少量已知工况样本下获取较高的工况识别精准率,而两个主视角组合的加权多核学习方法和三个主辅视角组合的多视角加权多核学习方法不与Hessian正则化集成建立的工况识别模型实现在适量已知工况样本下利用未知工况样本获取较高的工况识别精准率;其中,Hessian正则化协同训练工况识别模型的构建过程中,基于算法的正确性、泛化性、时间复杂性、稳定性方面综合考虑,选择用于支持向量机的Hinge损失函数,采用的核函数为RBF函数,Hessian的近邻数选定为每类所含的样本个数,迭代次数选取8次,实测地面示功图和电功率信号这两个视角对应的惩罚项调节参数通过调参后分别是1和1e‑1、1和1e‑2;分析并确定模型关键因素设置后,其构建具体过程是:将存储的实测地面示功图和电功率信号分别通过机理分析、先验知识和专家经验进行特征提取后得到各自的特征数据样本集,从中选出各自的训练样本集,通过Hessian正则化SVM协同训练算法得到工况识别模型,其中的Hessian正则化SVM协同训练算法的主要思想是:首先在2个不同视角的训练样本集上分别利用Hessian正则化SVM算法来训练初始分类器,再通过训练后的分类器预测无标记样本,然后挑选出置信度最高的无标记样本并添加到对方训练集中,再重新训练分类器,这样重复迭代8次后得到两个视角各自的最终输出分类器,最后再利用最终输出分类器分别对各自最终更新的训练集进行预测,预测值高的作为算法的输出分类器;其中,Hessian正则化多视角加权典型相关分析工况识别模型的构建过程中,从算法的正确性、泛化性、时间复杂性、实用性方面考虑,Hessian的近邻数选定为训练样本个数减1,公共子空间维数选取为各视角中维数最低的视角维数,将实测井口温度和实测井口压力两个视角特征数据合并成一个视角特征数据,则公共子空间维数为6,各视角权重采用增大视角倍数方式并通过调参来获取,作用小的视角增大的倍数高于作用大的视角,则实测地面示功图、电功率、井口温度和井口压力合并这三个特征视角权重通过调参后分别是1.2、1.2和9,训练样本个数为每类样本个数的15%时达到工况平均识别率的峰值,所以用于分类的训练样本个数远小于待识别样本个数,选取每类样本个数的15%以下为训练样本个数,且各视角的样本总数要一样;分析并确定模型关键因素设置后,其构建具体过程是:将存储的实测地面示功图、电功率、井口温度和井口压力信号分别通过机理分析、先验知识和专家经验进行特征提取后得到各自的特征数据样本集,将井口温度和井口压力两个特征数据样本集串接合并成一个新的特征数据样本集,然后从三个特征数据样本集中选出各自的训练样本集,通过Hessian正则化多视角加权典型相关分析算法得到三个降维的特征数据样本集,再结合余弦最近邻算法得到工况识别模型,其中的Hessian正则化多视角加权典型相关分析算法的主要思想是:利用Hessian正则化来更好地保持数据流形局部结构,结合多视角权重,从而找到一组线性的投影来发现多视角数据中的非线性相关,并使投影后的变量两两之间相关性的和最大化;其中,Hessian正则化加权典型相关分析工况识别模型:除了采用实测地面示功图和电功率信号两个视角,两视角权重调参后分别是1.2和1.2外,其模型构建过程、模型关键因素设置、算法思想都和Hessian正则化多视角加权典型相关分析工况识别模型相似;其中,多视角加权多核学习工况识别模型的构建过程中,从算法的正确性、泛化性、时间复杂性方面综合考虑,选择用于logistic回归的log损失函数,核函数为RBF,收敛迭代次数为1200次,各视角权重采用各视角权重累加和为1的方式并通过调参来获取,则实测地面示功图、电功率、井口温度信号这三个视角的权重通过调参后分别为0.15、0.8和0.05,惩罚项和正则项的调节参数通过调参后分别是1e‑3和1e‑1;分析并确定模型关键因素设置后,其构建具体过程是:将存储的实测地面示功图、电功率和井口温度信号分别通过机理分析、先验知识和专家经验进行特征提取后得到各自的特征数据样本集,然后从三个特征数据样本集中选出各自的训练样本集,通过多视角加权多核logistic回归学习算法得到工况识别模型,其中的多视角加权多核logistic回归学习算法的主要思想是:利用多视角的加权和核函数技术,将不同的核函数进行融合来挖掘多视角数据之间的内在联系,更加全面、更加灵活地表达多视角数据,再结合正则化约束和log损失函数具有的平滑性、对异常点敏感、可预测概率和适用于大数据实验的优势,从而增强算法的泛化能力和学习效率;其中,加权多核学习工况识别模型除了采用实测地面示功图和电功率信号两个视角,两视角权重调参后分别是0.15和0.85外,其模型构建流程、模型关键因素设置、算法思想都和多视角加权多核学习工况识别模型相似;其中,所述通过建立的工况识别模型进行抽油机井工况识别,具体为:若建立的工况识别模型为Hessian正则化协同训练工况识别模型,则在对应模型上采用SVM损失函数对应的一对一两分类器进行工况识别;若建立的工况识别模型为Hessian正则化加权典型相关分析工况识别模型和Hessian正则化多视角加权典型相关分析工况识别模型,则分别在对应模型上采用余弦最近邻多分类器进行工况识别;若建立的工况识别模型为加权多核学习工况识别模型和多视角加权多核学习工况识别模型,则在对应模型上采用logistic回归损失函数对应的一对多两分类器进行工况识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811463075.8/,转载请声明来源钻瓜专利网。