[发明专利]语音增强方法及装置有效
申请号: | 201910388459.6 | 申请日: | 2019-05-10 |
公开(公告)号: | CN111292761B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 纪伟;于伟维;潘思伟;雍雅琴;董斐;孟建华;林福辉 | 申请(专利权)人: | 展讯通信(天津)有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0264;G10L21/034;G10L25/18;G10L25/21;G10L25/60;G10L25/84 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 300456 天津市天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 装置 | ||
本公开涉及语音增强方法及装置,所述方法包括:计算当前帧音频信号的语音存在概率,所述语音存在概率表示所述当前帧音频信号中语音信号的存在概率;利用所述语音存在概率获得下一帧音频信号的噪声方差;利用所述下一帧音频信号的噪声方差,对所述下一帧音频信号进行语音增强。本公开基于语音存在概率对下一帧音频信号进行的语音增强,可以有效提高噪声抑制水平,并降低语音信号的损失,从而保证噪声抑制后的语音信号的完整性与可懂度,提升语音通话质量。
技术领域
本公开涉及语音处理技术领域,尤其涉及一种语音增强方法及装置。
背景技术
在日常生活中使用手机等移动设备进行语音通话过程中,讲话者经常置身于充满各种各样噪声的背景环境中。麦克风采集到的语音信号被噪声污染,即上行信号是含有噪声的语言信号。如果不对上行信号进行处理,远端接收者将很难听到清晰的语音,甚至无法理解语音的含义。因此,必须对近端含噪语音进行噪声抑制,将语音增强后的干净语音作为上行信号,从而提升通话质量。
发明内容
有鉴于此,根据本公开的一个方面,本公开提出了一种语音增强方法,所述方法包括:
计算当前帧音频信号的语音存在概率,所述语音存在概率表示所述当前帧音频信号中语音信号的存在概率;
利用所述语音存在概率获得下一帧音频信号的噪声方差;
利用所述下一帧音频信号的噪声方差,对所述下一帧音频信号进行语音增强。
在一种可能的实施方式中,所述计算当前帧音频信号的语音存在概率,包括:
计算当前帧音频信号的语音不存在概率,所述语音不存在概率为所述当前帧音频信号中语音信号的不存在概率;
计算当前帧音频信号的先验信噪比;
利用所述当前帧音频信号的语音不存在概率及先验信噪比计算所述当前帧音频信号的语音存在概率。
在一种可能的实施方式中,所述计算当前帧音频信号的语音不存在概率,包括:
根据当前帧音频信号的功率谱计算当前帧音频信号的功率谱最小值;
利用所述功率谱最小值计算当前帧音频信号的语音不存在概率。
在一种可能的实施方式中,所述根据当前帧音频信号的功率谱计算当前帧音频信号的功率谱最小值,包括:
利用如下公式获取所述当前帧音频信号的功率谱最小值:
其中,Smin(k,λ)表示当前λ帧第k个子频带的功率谱最小值,Smin(k,λ-1)表示λ-1帧第k个子频带的功率谱最小值,S(k,λ)表示当前λ帧第k个子频带的功率谱,S(k,λ-1)表示λ-1帧第k个子频带的功率谱,α1,α2,β为预设参数。
在一种可能的实施方式中,所述利用所述功率谱最小值计算当前帧音频信号的语音不存在概率,包括:
利用如下公式获取当前帧音频信号的第一比值:
其中,γmin(k,λ)表示当前λ帧第k个子频带的第一比值,Y(k,λ)表示当前λ帧第k个子频带的幅度谱,Smin(k,λ)表示所述当前λ帧第k个子频带的功率谱最小值,B表示偏置补偿参数;
根据以下公式获取当前帧音频信号的第二比值:
其中,η(k,λ)表示当前λ帧第k个子频带的第二比值, S(k,λ)表示当前λ帧第k个子频带的功率谱;
根据所述第一比值及所述第二比值计算当前帧信号的语音不存在概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于展讯通信(天津)有限公司,未经展讯通信(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910388459.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多维矩阵的双向全双工中继系统信道估计方法
- 下一篇:半导体装置