[发明专利]语音信号自动增益控制方法在审
申请号: | 201710181857.1 | 申请日: | 2017-03-24 |
公开(公告)号: | CN106992003A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 李云飞 | 申请(专利权)人: | 深圳北斗卫星信息科技有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L17/20 |
代理公司: | 北京华仲龙腾专利代理事务所(普通合伙)11548 | 代理人: | 李静 |
地址: | 518000 广东省深圳市宝安区西乡*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 自动增益控制 方法 | ||
1.一种语音信号自动增益控制方法,其特征在于,包括:
获得来自麦克风的语音信号;
将所述语音信号进行时域预处理,以得到第一信号;
将所述第一信号从时域向频域变换,以得到第二信号;
从所述第二信号中提取出描述人声特征的基音、共振峰频点;
将前256个所述频点划分为16个语音频段;
根据所述频点的有效性判断是语音帧还是静音帧,如果有效则认为当前是有人说话的语音帧,如果无效则视为无人说话的静音帧;
对于语音帧执行增益的自动调整算法,对于静音帧执行非人声噪声幅度计算算法,以得到第三信号;
将所述第三信号通过快速傅立叶逆变换转回时域以得到第四信号;
根据所述第四信号通过DAC电路输出语音。
2.根据权利要求1所述的语音信号自动增益控制方法,其特征在于,所述方法还包括:如果在当前语音帧中未找到人声特征信息,则当前语音帧被视为静音帧,此时对非人声噪声幅度进行估算,并依次计算16个语音频段的噪声幅度值并记录。
3.根据权利要求1和2所述的语音信号自动增益控制方法,其特征在于,对非人声噪声幅度进行估算,并依次计算16个语音频段的噪声幅度值并记录包括:
步骤1,采用下式计算每个语音段的噪声幅度:
其中,Af为噪声幅度;
μ为前一语音帧所有频段噪声幅度值的均值;
σ为当前频段前一帧的、幅度值的、与μ的标准差;
A测量为当前频段处的实测各频点噪声幅度的累加值;
A估计为使用最小二乘算法、拟合当前语音频段噪声参数队列中前16个当前频段处的噪声幅度值,得到的一个当前频点最新噪声估计值;
步骤2,将步骤1计算出的当前语音频段的Af加入语音频段噪声参数队列末尾,队列采用先进先出模式,一直维持最新的16个计算值;
步骤3,当前静音帧所有语音频段的噪声幅度值均计算完后,计算μ、σ值,加入到语音频段噪声参数队列,这一队列中保存的数据将在下一个静音帧到来时运用到步骤1中的计算公式中。
4.根据权利要求1所述的语音信号自动增益控制方法,其特征在于,在语音帧中通过对256个语音频点逐点调整语音的频域幅度值,从而完成语音增益的自动调整。
5.根据权利要求3所述的语音信号自动增益控制方法,其特征在于,所述自动调整算法具体包括:
步骤a,设置语音帧噪声比例因子初始值Kn=1;
步骤b,依次计算16个语音频段中各频点实测幅度的累加值,并除以该频段语音频段噪声参数队列中最后一个Af值,得到每个语音频段的噪声比例因子Knf;
步骤c,遍历16个语音频段的Knf,找出Knf<1.5的值中最大的一个,并将其赋值给Kn,如找不到符合条件的Knf,则保持Kn=1不变;
步骤d,执行增益自动调整操作,使用下式逐频点计算调整后的幅度值:
Ag=G(Ar-Kn*Af)
其中,G为增益比例调节因子,由用户通过旋钮进行调整;Ar为当前频点实测的幅度值。
6.根据权利要求5所述的语音信号自动增益控制方法,其特征在于,Af是出现语音帧前,最后一个静音帧的噪声幅度值,从语音频段噪声参数队列末尾取出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳北斗卫星信息科技有限公司,未经深圳北斗卫星信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710181857.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于改进含噪语音识别的动态声学模型切换
- 下一篇:一种调整视频的方法及终端