[发明专利]语音增强的方法有效
申请号: | 201010227959.0 | 申请日: | 2010-07-15 |
公开(公告)号: | CN101894563A | 公开(公告)日: | 2010-11-24 |
发明(设计)人: | 叶利剑 | 申请(专利权)人: | 瑞声声学科技(深圳)有限公司;瑞声光电科技(常州)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 | ||
1.一种语音增强的方法,该方法应用于实时语音信号处理系统中,所述实时语音信号处理系统包括麦克风及集成于麦克风中的语音信号处理芯片,其特征在于:该方法包括以下步骤:(1)芯片对语音增强系统输入的带噪语音信号进行分帧,预加重处理,经短时傅里叶变换到频域;(2)将变换到频域后的带噪语音信号划分为若干频带,再计算各个频带能量并进行平滑,得到经平滑后的每个频带内的信号能量,所述信号能量包括语音能量和噪音能量,并得到所述噪音能量的初始估计值;(3)芯片计算各个频带当前帧的后验信噪比,并由前一帧的先验信噪比估计值得到当前帧的先验信噪比估计值;(4)采用计权噪声估计法对先验信噪比进行修正;(5)根据得到的修正先验信噪比估计值,计算各个频带的衰减增益;(6)采用门限判决对增益系数进行调整;(7)用得到的衰减增益,对划分到各频带的信号频谱进行处理;(8)由修正的先验信噪比估计值对当前帧进行判决,判断是否是噪声;(9)根据噪声判决对各频带的噪声进行更新;(10)芯片将处理后的频域信号变换到时间域,进行去加重处理,变成输出信号。
2.根据权利要求1所述的语音增强的方法,其特征在于:所述步骤(1)的分帧过程为:对在时域中的带噪语音信号进行分帧,是将带噪语音信号以帧为单位等分成若干带噪信号单元;所述带噪信号单元由采样点组成,本发明中选取了8KHz的采样频率,帧长设定成10~35ms之间,任意一帧带噪信号单元具有的帧长为256。
3.根据权利要求1所述的语音增强的方法,其特征在于:所述步骤(2)中的平滑过程为:用如下公式计算每个子区间的能量并进行平滑:
E(m,k)=|X(m,k)|2 0≤k≤N-1
Y(m,k)=αY(m-1,k)+(1-α)E(m,k) 0≤k≤N-1
其中,Y(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子,N为选取的频带总数,即23。
4.根据权利要求1所述的语音增强的方法,其特征在于:所述步骤(4)中的计权噪声估计方法包括:以之前得到的后验信噪比,参照非线性函数,得到计权因子,对先验信噪比估计值进行加权处理;接下来,进行衰减增益因子的计算,这里基于前面计算得出的先验信噪比估计值,采用频谱相减的方法得到衰减因子,其具体公式如下:
其中,对于不同频带,a为不同的常数,这里考虑到,噪声主要集中在较低的频带,因此对于中低频段和高频,取不同的a;所述非线性函数为:
其中γ1取1.5左右,γ2取200,θz取20;
根据得到的修正先验信噪比估计值计算各个频带的衰减增益q(m,k)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞声声学科技(深圳)有限公司;瑞声光电科技(常州)有限公司,未经瑞声声学科技(深圳)有限公司;瑞声光电科技(常州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010227959.0/1.html,转载请声明来源钻瓜专利网。