[发明专利]基于GAN网络的分布式光纤语音增强方法及隧道救援系统在审
申请号: | 202210812753.7 | 申请日: | 2022-07-12 |
公开(公告)号: | CN114898766A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 盛鹏;罗煜;何子牛;王茂宁;钟羽中;张晨思 | 申请(专利权)人: | 四川高速公路建设开发集团有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L25/18;G10L25/27;G10L19/02;G10L19/022;G10L19/26;H04B10/071;G06N20/00 |
代理公司: | 成都厚为专利代理事务所(普通合伙) 51255 | 代理人: | 王杰 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gan 网络 分布式 光纤 语音 增强 方法 隧道 救援 系统 | ||
1.基于GAN网络的分布式光纤语音增强方法,其特征在于,包括:
采集DAS语音信号;
获取纯净语音信号;
对采集到的DAS语音信号进行预处理;
将预处理后的DAS语音信号转化为梅尔频谱特征图;
将所述梅尔频谱特征图与所述纯净语音信号输入预先构建的GAN网络。
2.根据权利要求1所述的基于GAN网络的分布式光纤语音增强方法,其特征在于,对采集到的DAS语音信号进行预处理,包括:
对所述DAS语音信号进行预加重;
对预加重后的DAS语音信号进行分帧;
对分帧后的DAS语音信号进行加窗处理。
3.根据权利要求2所述的基于GAN网络的分布式光纤语音增强方法,其特征在于,所述预加重的变换公式为:
式中,alpha代表预加重系数,其取值位于0.9-1.0之间;x(t)代表t时刻音频振幅;y(t)代表预加重后t时刻音频的振幅。
4.根据权利要求2所述的基于GAN网络的分布式光纤语音增强方法,其特征在于,对预加重后的DAS语音信号进行分帧时,相邻两帧之间存在重叠区域。
5.根据权利要求2所述的基于GAN网络的分布式光纤语音增强方法,其特征在于,对分帧后的DAS语音信号进行加窗处理,包括:
分别将每帧信号乘以汉明窗。
6.根据权利要求1所述的基于GAN网络的分布式光纤语音增强方法,其特征在于,将预处理后的DAS语音信号转化为梅尔频谱特征图,包括:
对预处理后的DAS语音信号进行快速傅里叶变换得到DAS语音信号的能量谱;
利用Mel尺度的三角型滤波器组对所述DAS语音信号的能量谱进行滤波,得到梅尔频谱特征图。
7.根据权利要求1所述的基于GAN网络的分布式光纤语音增强方法,其特征在于,所述GAN网络的构建方法包括:
构建用于实现频域到时域的上采样的生成器;
构建判别器;
将所述生成器和判别器组合构成完成的GAN网络。
8.根据权利要求1所述的基于GAN网络的分布式光纤语音增强方法,其特征在于,所述GAN网络包括生成器和至少一个判别器,所述生成器包括两个过渡层和四个上采样层,所述上采样层位于两个过渡层之间,每个上采样层之后接一个残差空洞卷积块,所述判别器包括三层卷积层和四层下采样层。
9.根据权利要求7所述的基于GAN网络的分布式光纤语音增强方法,其特征在于,所述残差空洞卷积块由四层空洞卷积构成,所述四层空洞卷积的扩张系数分别为1、3、9和27。
10.基于GAN网络的隧道救援系统,其特征在于,包括:
第一容器,设置于信号采集点;
光缆,所述光缆的第二端缠绕在第一容器的外壁上,用于采集DAS语音信号;
光纤传感设备,所述光纤传感设备的输入端与光缆的第一端连接;所述光纤传感设备用于获取纯净语音信号,对采集到的DAS语音信号进行预处理,将预处理后的DAS语音信号转化为梅尔频谱特征图,并将所述梅尔频谱特征图与所述纯净语音信号输入预先构建的GAN网络,以及根据经GAN网络处理后的DAS语音信号对信号采集点进行定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川高速公路建设开发集团有限公司,未经四川高速公路建设开发集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210812753.7/1.html,转载请声明来源钻瓜专利网。