[发明专利]一种基于深度强化学习的叠加速度谱拾取方法及处理终端有效
申请号: | 201810571640.6 | 申请日: | 2018-06-05 |
公开(公告)号: | CN109031421B | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 顾元 | 申请(专利权)人: | 广州海洋地质调查局 |
主分类号: | G01V1/36 | 分类号: | G01V1/36 |
代理公司: | 广州君咨知识产权代理有限公司 44437 | 代理人: | 江超 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于深度强化学习的叠加速度谱拾取方法及处理终端,所述方法包括以下步骤:步骤S1:获取包括地震反射波的原始共中心点地震道集数据并计算出以各个时刻下的最优扫描速度组成的叠加速度谱;步骤S2:将叠加速度谱输入至自编码网络,得到编码后的高阶能量团特征;步骤S3:将高阶能量团特征编码输入至策略网络,拾取各个时刻下的最优扫描速度,输出速度序列;步骤S4:对速度序列进行评价,输出奖励值;步骤S5:根据奖励值来训练策略网络;步骤S6:迭代执行步骤S3至步骤S5直至步骤S4获取到设定的最大奖励值时,输出最优速度序列。本发明无需人工干预,实现智能化的速度谱拾取;拾取过程中能够消除多次波的干扰,拾取叠加速度曲线更准确。 | ||
搜索关键词: | 拾取 速度谱 叠加 速度序列 策略网络 处理终端 强化学习 能量团 高阶 输出 奖励 扫描 地震反射波 迭代执行 共中心点 人工干预 速度曲线 特征编码 地震道 智能化 自编码 网络 | ||
【主权项】:
1.一种基于深度强化学习的叠加速度谱拾取方法,其特征在于:所述方法包括以下步骤:步骤S1:获取包括地震反射波的原始共中心点地震道集数据;步骤S2:根据步骤S1中的共中心点地震道集数据经预设算法计算出以各个时刻下的最优扫描速度组成的叠加速度谱,输出为用二维数组表示的叠加速度谱;步骤S3:将步骤S2中的二维数组输入至自编码网络,自编码网络通过编码器和解码器学习提取出叠加速度谱的能量团特征,编码器输出经对叠加速度谱编码后的能量团特征;步骤S4:将步骤S3经对叠加速度谱编码后的能量团特征编码输入至策略网络,策略网络对能量团特征进行处理,使得输入经编码的能量团特征编码与步骤S2的叠加速度谱中各个时刻下对应的最优扫描速度对应起来,以此输出速度序列;步骤S5:应用步骤S4输出的速度序列对共中心点地震道集进行动校正,动校正量按正常时差公式计算:式中,xj表示第j个炮检距,△ti,j为ti时刻第j个炮检距处的动校正量,ti,0为ti时刻垂直反射时间,v为步骤S4输出的速度序列,速度序列由各个时刻下对应的最优扫描速度vi组成;步骤S6:将经过步骤S5动校正后的共中心点地震道集进行多次波压制,经过多次波压制后,将多次波进行剔除,提取出一次反射波;步骤S7:对经过步骤S6提取出的一次反射波的共中心点地震道集计算出基于拉东变换公式的剩余速度谱,输出为用二维数组表示的剩余速度谱;步骤S8:在步骤S7计算出的剩余速度谱中,对剩余速度谱的幅度值进行时间t方向上的叠加,得到q方向上的叠加曲线图,根据所述叠加曲线图的最大幅度值到q=0轴的距离,按从大至小设置相应的从小到大的奖励值;步骤S9:根据步骤S8计算出的奖励值采用策略梯度的方法来训练步骤S4中的策略网络;步骤S10:迭代执行步骤S4至步骤S9,当叠加曲线图的最大幅度值到q=0轴的距离为0时,获取的奖励值为最大,即判断对应所述步骤S4输出的速度序列为最优,否则继续对策略网络进行训练;以获取最大奖励值对应的速度序列经过插值后输出即为最终所需要拾取的共中心点道集的叠加速度曲线。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州海洋地质调查局,未经广州海洋地质调查局许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810571640.6/,转载请声明来源钻瓜专利网。