[发明专利]语音增强的方法有效
申请号: | 201010227959.0 | 申请日: | 2010-07-15 |
公开(公告)号: | CN101894563A | 公开(公告)日: | 2010-11-24 |
发明(设计)人: | 叶利剑 | 申请(专利权)人: | 瑞声声学科技(深圳)有限公司;瑞声光电科技(常州)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 增强 方法 | ||
【技术领域】
本发明提供一种语音增强的方法,尤其涉及一种基于麦克风的语音增强的方法。
【背景技术】
由于大量环境噪声的存在,麦克风采集到的语音信号普遍信噪比不够高,所以需要通过语音增强的方法来提升输入语音的信噪比。现有的语音增强算法多作为产品的附加功能,其算法作为芯片集成的一个模块,或采用纯软件的方式来实现。还没有产品采用直接实现将语音增强算法作为一个芯片,集成在麦克风中,进行消噪处理。
相关技术中语音增强的方法,麦克风的指向性不强,传输器输出的不是降噪后的信号,对残余噪声的衰减处理能力差。
因此实有必要提供一种新型的语音增强的方法。
【发明内容】
本发明需解决的技术问题是提供一种可实现麦克风指向性、增强语音处理能力的语音增强的方法。
为解决上述技术问题,本发明提供一种语音增强的方法,该方法应用于实时语音信号处理系统中,所述实时语音信号处理系统包括麦克风及集成于麦克风中的语音信号处理芯片,该方法包括以下步骤:(1)芯片对语音增强系统输入的带噪语音信号进行分帧,预加重处理,经短时傅里叶变换到频域;(2)将变换到频域后的带噪语音信号划分为若干频带,再计算各个频带能量并进行平滑,得到经平滑后的每个频带内的信号能量,所述信号能量包括语音能量和噪音能量,并得到所述噪音能量的初始估计值;(3)芯片计算各个频带当前帧的后验信噪比,并由前一帧的先验信噪比估计值得到当前帧的先验信噪比估计值;(4)采用计权噪声估计法对先验信噪比进行修正;(5)根据得到的修正先验信噪比估计值,计算各个频带的衰减增益;(6)采用门限判决对增益系数进行调整;(7)用得到的衰减增益,对划分到各频带的信号频谱进行处理;(8)由修正的先验信噪比估计值对当前帧进行判决,判断是否是噪声;(9)根据噪声判决对各频带的噪声进行更新;(10)芯片将处理后的频域信号变换到时间域,进行去加重处理,变成输出信号。
优选的,所述步骤(1)的分帧过程为:对在时域中的带噪语音信号进行分帧,是将带噪语音信号以帧为单位等分成若干带噪信号单元;所述带噪信号单元由采样点组成,本发明中选取了8KHz的采样频率,帧长设定成10~35ms之间,任意一帧带噪信号单元具有的帧长为256。
优选的,所述步骤(2)中的平滑过程为:用如下公式计算每个子区间的能量并进行平滑:
E(m,k)=|X(m,k)|2 0≤k≤N-1
Y(m,k)=αY(m-1,k)+(1-α)E(m,k) 0≤k≤N-1
其中,Y(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子,N为选取的频带总数,即23。
优选的,所述步骤(4)中的计权噪声估计方法包括:以之前得到的后验信噪比,参照非线性函数,得到计权因子,对先验信噪比估计值进行加权处理;接下来,进行衰减增益因子的计算,这里基于前面计算得出的先验信噪比估计值,采用频谱相减的方法得到衰减因子,其具体公式如下:
其中,对于不同频带,a为不同的常数,这里考虑到,噪声主要集中在较低的频带,因此对于中低频段和高频,取不同的a;所述非线性函数为:
其中γ1取1.5左右,γ2取200,θz取20;
根据得到的修正先验信噪比估计值计算各个频带的衰减增益q(m,k)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞声声学科技(深圳)有限公司;瑞声光电科技(常州)有限公司,未经瑞声声学科技(深圳)有限公司;瑞声光电科技(常州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010227959.0/2.html,转载请声明来源钻瓜专利网。