[发明专利]近距离交谈场景下双麦克风移动电话的实时语音降噪方法在审
申请号: | 201910945319.4 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110660406A | 公开(公告)日: | 2020-01-07 |
发明(设计)人: | 谭可;闫永杰 | 申请(专利权)人: | 大象声科(深圳)科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L25/30 |
代理公司: | 44362 深圳快马专利商标事务所(普通合伙) | 代理人: | 赵亮;刘朗星 |
地址: | 518000 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信号 掩模 声学特征 近距离 主信道 递归 降噪 卷积 语音 场景 麦克风 背景干扰 波形信号 模拟语音 时间动态 实时语音 通话噪音 信道 噪声 噪音 网络 合成 说话 应用 | ||
本发明涉及的近距离交谈场景下双麦克风移动电话的实时语音降噪方法,包括如下步骤:接收主信道和辅信道中的带噪语音信号,其中包含语音和背景干扰噪声;从带噪语音信号中提取原始声学特征;卷积递归网络CRN,将原始声学特征输入卷积递归网络CRN中以模拟语音的时间动态,并对其进行掩模估计,得到相敏掩模PSM;将估计的相敏掩模PSM应用于主信道带噪语音信号以重新合成降噪语音的波形信号。本发明性能优秀,能够有效的在近距离交谈场景下降低通话噪音,与现有技术相比具有更强的实用性,且不依赖于噪音与说话者。
技术领域
本发明涉及电子通讯领域,更具体地说,涉及近距离交谈场景下双麦克风移动电话的实时语音降噪方法。
背景技术
随着移动电话的广泛使用,移动语音通信已成为越来越重要的应用,如果远端讲话者处于嘈杂的声学环境中,则接收语音的质量和可懂度会因为背景噪声而严重降低。为了减弱带噪语音信号的背景噪声,大多数移动电话都已集成了语音增强算法。通常,在移动电话中设置有包括两到四个麦克风以产生更好的增强性能。在典型的双麦克风配置中,主麦克风设置于移动电话的底部,辅麦克风设置于顶部,如图5所示。在近距离交谈场景中,语音信号是以主麦克风与人嘴之间的小距离来进行拾取的。
近年来,语音降噪已经开始引入监督学习,通过训练数据来学习语音或噪声信号中的判别模式。与基于对语音和噪声信号进行统计分析的传统语音增强不同,监督式语音降噪是数据驱动的,并根据详细的训练样本自动地学习模式,这很大程度得益于深度学习的使用。然而,就目前来言,基于深度学习的双麦克风语音降噪的研究并不多,有一定的局限性,大多数双麦克风语音降噪方法性能不高,存在依赖噪声或者依赖说话者的缺陷。
在监督式语音降噪中,公认的方法是时频(T-F)掩模,通过定义语音的T-F表示的理想掩模来抑制背景噪声并保留目标语音。2013年,深度神经网络(深度神经网络DNN)首次被引入监督式语音降噪,其中深度神经网络DNN被用作T-F掩模估计器。从那时起,针对监督式语音降噪开发出许多方法进行T-F掩模,这些方法已被证明对掩模估计是非常有效的。基于深度学习的监督式降噪被广泛认为是最先进的方法,并且极大地提升了降噪性能,包括首次展示出在带噪环境中为听力受损和听力正常的听众带来语音可懂度的实质性改善。
尽管在基于深度学习的单信道语音降噪和远场多信道语音降噪方面已经取得了显著进步,但在近距离交谈场景的移动通信中,对基于深度学习的双麦克风语音降噪的研究还不多。2014年,深度神经网络DNN被引入近距离双麦克风语音降噪,发现它比几种典型的传统算法具有更好的性能。鉴于近来卷积递归网络CRN在单信道语音降噪方面的成功。
现有的方案存在如下缺点:
1.大多数双麦克风语音降噪方法性能不高;
2.存在依赖噪声或者依赖说话者的缺陷。
本发明提供了近距离交谈场景下双麦克风移动电话的实时语音降噪方法,进一步地说,是基于卷积递归网络CRN的掩模估计方法,该方法既利用信道内特征又利用信道间特征。此外,本发明还提供用于信号再合成的新策略,其利用信道间信号差的相位而不是主信道带噪相位,通过大规模训练,本发明的卷积递归网络CRN方法实现了不依赖噪声且不依赖说话者的语音降噪。此外,本发明规避了未来时间帧的使用,并且基于计算效率高的卷积递归网络CRN模型,实现了实时进行用于移动通信的双麦克风语音降噪。
发明内容
本发明要解决的技术问题在于如何通过采用近距离交谈场景下双麦克风移动电话的实时语音降噪方法,以解决现有技术中的双麦克风语音降噪方法性能不高、依赖噪声或者依赖说话者的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大象声科(深圳)科技有限公司,未经大象声科(深圳)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910945319.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音信号的提纯方法及装置
- 下一篇:一种音频处理方法及装置