[发明专利]基于特征库的测井数据格式自动识别与转换方法有效
申请号: | 201010203222.5 | 申请日: | 2010-06-18 |
公开(公告)号: | CN101853309A | 公开(公告)日: | 2010-10-06 |
发明(设计)人: | 王卫;李光军;王慧萍;吴海忠;吕和军;杨春文;张才元;郭树兵;李晓华;顾玉君;王金兴;吴爱红 | 申请(专利权)人: | 中国石油化工集团公司;中国石化集团河南石油勘探局地球物理测井公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;E21B47/00 |
代理公司: | 郑州睿信知识产权代理有限公司 41119 | 代理人: | 陈浩 |
地址: | 100728 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 测井 数据格式 自动识别 转换 方法 | ||
技术领域
本发明属于石油工程中测井数据格式自动识别、转换技术,涉及了石油工程中多种测井数据格式如何自动、有效地识别其格式,从而快速、准确、自动地识别和转换这些数据,尤其涉及基于特征库的测井数据格式自动识别与转换方法。
背景技术
在石油工程测井专业中,测井数据种类繁多,存储格式多种多样,尤其是野外测井数据,不同的仪器厂商有不同的数据存储格式。据统计,国内外现有测井数据存储格式多达100多种。
这些数据在进行测井资料处理解释之前往往要进行数据格式转换,以便处理系统能够使用。
现有的测井资料处理系统的数据转换都采用人工识别方式或半智能化模糊识别方式。
所谓人工识别方式,要求确切知道要转换的数据文件类型,调用相应的转换模块,这种转换方式速度快,效率高,缺点是处理人员必须对该数据格式十分清楚,否则就无法实现转换。
半智能化模糊识别方式则要求用户知道要转换的数据文件的可能类型,并指定相应的可能转换模块。这种转换方式给出一种或多种可能的数据格式,让转换模块在给定的格式中自动搜索、匹配,但必须保证要处理的数据格式属于给定的可能格式的一种,且给定的可能性越多,处理速度越慢,因为系统要对给定的模块逐个进行扫描、匹配。同时要求多选的格式模块必须对格式的描述判断严谨、唯一,否则将会引起混乱,将无法实现正确解编。更严重的问题是如果新增一个数据格式,则可能甚至是必须要修改原有的全部转换模块软件。
发明内容
本发明的目的是提供一种能够自动、准确地识别并完成转换的基于特征库的测井数据格式自动识别与转换方法,以解决现有的数据转换采用人工识别方式、半智能化模糊识别方式的处理速度慢、效率低、人工干预多、劳动强度大、新增数据格式不便的问题。
为实现上述目的,本发明的基于特征库的测井数据格式自动识别与转换方法步骤如下:
(1)提取各种测井数据格式中的特征信息,建立数据格式特征库;
(2)将待转换的测井数据文件与特征库中存储的测井数据格式的特征信息进行匹配,并记录下相匹配的数据格式转换模块名称;
(3)依据特征库匹配结果,调用相匹配的数据格式转换模块再进行精确匹配,匹配成功后进行扫描、转换,完成数据格式的信息获取与转换。
进一步的,所述步骤(1)中特征库的建立是利用测井数据文件格式内部特有信息、文件命名特征在计算机磁盘上产生一个特征库文件。
进一步的,所述特征库是由多个测井数据格式的多条特定信息构成,这些特定信息包括用于描述所有的操作数信息的信息描述、可分别进行定点、段内和偏移搜索方式设置的搜索域、用于特征位置范围限定的起始点、终止点、用于操作数的数据类型设置的值类型、用于操作数最大值、最小值范围设置的最大值和最小值。
进一步的,所述步骤(2)中待转换的测井数据文件与特征库中存储的测井数据格式特征信息进行匹配包括以下步骤:
1)从计算机磁盘上特征库的存储目录中读取特征库全部内容到计算机内存中,并记录特征库中数据格式个数;
2)从特征库的第一个数据格式的特征信息区域开始,将该数据格式的特征信息与待转换数据格式的相应位置的特征信息进行一一匹配,如果当前数据格式的各特征信息都与待转换数据文件的特征信息相匹配,则记录下该数据格式所对应的解编模块名称;
3)进入特征库的下一个数据格式特征信息区域,按2)的方式与待转换数据格式的相应信息区进行匹配,并记录下匹配成功的数据格式转换模块名称,直至特征库中全部数据格式特征信息查找完毕;
4)如果上述步骤2)、3)没有查找到匹配的数据格式,则提示手动选择转换模块或者终止该项操作;如果只找到一个匹配的转换模块,则加载该转换模块,调用数据格式转换模块接口函数,然后进入精确匹配阶段;如果存在多个匹配的转换模块,则提示用户从多个模块中选择一个转换模块,用户选择后,加载该数据格式转换模块,调用数据格式转换模块接口函数,进入精确匹配阶段。
进一步的,所述步骤(3)中的精确匹配方式包括如下步骤:
1)当前选中的转换模块依据自己所针对的数据格式的特有特征信息,再次识别待转换的数据文件,如果该转换模块能够正确识别该数据文件,则退出扫描函数,并将该数据文件所包含的井名、曲线数、曲线名等信息提供给用户界面,告知用户,该数据文件能够被自己正确识别;否则,退出扫描函数,告知用户该数据格式自己不能识别,等待用户进一步处理;
2)当计算机系统收到能够正确识别数据文件的信息后,进入用户信息修改界面,等待用户修改、编辑数据格式信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油化工集团公司;中国石化集团河南石油勘探局地球物理测井公司,未经中国石油化工集团公司;中国石化集团河南石油勘探局地球物理测井公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010203222.5/2.html,转载请声明来源钻瓜专利网。