[发明专利]基于听觉滤波器组和卷积神经网络的全局信噪比估计方法在审
申请号: | 202110025619.8 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112885375A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 王龙标;李楠;党建武;张苏林;于波 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/30 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 听觉 滤波器 卷积 神经网络 全局 估计 方法 | ||
本发明公开一种基于听觉滤波器组和卷积神经网络的全局信噪比估计方法,包括:1)对含噪语音利用bark尺度利用高通滤波器和低通滤波器将音频分割成不同的子带,并计算每个子带的能量;2)构建卷积神经网络,计算每个子带中噪声比例,进而计算子带中噪声能量;3)计算全局SNR。本发明主要针对噪声环境下全局信噪比估计提出了一种基于人耳滤波器组并且提出了一种针对多子带的卷积神经网络的动态噪声估计方法。针对不同子带的能量,利用卷积神经网络,提出了一种噪声比例估计方法,它能够动态的对不同子带噪声能量比例进行估计。利用动态的子带噪声能量进而将子带融合到全频带信噪比估计方法,进一步提高了全局信噪比计算的准确性。
技术领域
本发明涉及语音信号处理领域,特别是针对在信噪比比较低的环境中噪声估计不准确的问题,具体涉及一种基于听觉滤波器组和卷积神经网络的全局信噪比估计方法。
背景技术
近年来,智能家居、对话机器人、智能音响等新兴产业蓬勃发展,给人们的生活方式以及人和机器的交互方式产生了极大的变化,语音交互作为一个新的交互方式在这些新兴领域中得到了广泛的应用。随着深度学习应用在语音识别中,识别性能得到了很大的提高,识别率已经超过95%,识别效果基本上已经能达到了人的听觉水平。但是以上这些仅限于在近场的条件下,噪声和房间所产生的混响非常小,怎样在复杂场景下(噪声很多或者混响很大)达到一个很好的识别效果成为极为重要的用户体验。
噪声估计是远场语音识别的一个重要研究方向。在嘈杂的环境下,噪声的大小对干净语音的影响大小通常可以表示成信噪比(SNR),SNR定义为以分贝(dB)表示的信号功率与噪声功率的比值。准确的信噪比估计可以帮助设计补偿噪声影响的算法和系统,如鲁棒的语音识别系统、语音增强和噪声抑制。然而噪声估计信噪比是一项具有挑战性的任务,因为我们通常不知道在一个环境内不同种类的噪声是怎样影响原始音频的。
通常来说,SNR估计通常分为两种,一种是局部SNR估计,他们通常关注于帧级别的SNR估计;另一种是全局SNR估计,这种SNR通常关注噪声在一句话中的整体分布。这个工作中,我们主要解决全局SNR的估计问题。
对于全局SNR的主要方法分为两种:一种是传统上基于信号处理方法的SNR估计方法,典型的方法有波形能量分布分析(WADA)的方法,这种方法假设语音和噪声分别建模为伽马和高斯分布,这种方法的问题是假设背景噪声为高斯噪声,但是日常生活中不光存在高斯噪声,还有存在多种不同种类的噪声,所以这个方法在实际应用中存在很大的限制。另外一种方法是基于深度学习的方法,这种方法通常是根据输入不同种类的语音特征来进行噪声的估计,但是随着真实环境下信噪比的降低,以及非稳态噪声的影响,这种方法的性能会急剧下降。所以在真实场景下提出一种全局SNR估计的方法依然是个具有挑战性的课题。
发明内容
本发明目的在于探索一种利用卷积神经网络来计算听觉滤波器组中每个子带的噪声能量占比从而提高全局SNR估计准确性的方法。
本发明的技术方案是一种基于听觉滤波器组和卷积神经网络的全局信噪比估计方法,具体包括:1)对含噪语音利用bark尺度利用高通滤波器和低通滤波器将音频分割成不同的子带,并计算每个子带的能量;2)构建卷积神经网络,计算每个子带中噪声比例,进而计算子带中噪声能量;3)计算全局SNR。
具体步骤如下:
1)基于Bark尺度的滤波器组
用全局全频带方法很难区分噪声和带噪语音。为了克服这一点,在本研究中,我们使用了多子带方法。噪声在不同频率有不同的分布。在高SNR条件下,由于噪声主要分布在高频段,利用子带的高频分量可以很容易地识别噪声。在低信噪比条件下,从噪声中估计语音和噪声的能量是困难的。子带的使用可以将噪声处理成多个频带,从而更容易确定语音和噪声部分。将含噪语音分为不同频率的子带,可以提高噪声和语音的区分能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110025619.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无刻度镗刀
- 下一篇:一种锆管靶及生产方法