[发明专利]语音信号自动增益控制方法在审
申请号: | 201710181857.1 | 申请日: | 2017-03-24 |
公开(公告)号: | CN106992003A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 李云飞 | 申请(专利权)人: | 深圳北斗卫星信息科技有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L17/20 |
代理公司: | 北京华仲龙腾专利代理事务所(普通合伙)11548 | 代理人: | 李静 |
地址: | 518000 广东省深圳市宝安区西乡*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种语音信号自动增益控制方法,包括获得来自麦克风的语音信号;将语音信号进行时域预处理,以得到第一信号;将第一信号从时域向频域变换,以得到第二信号;从第二信号中提取出描述人声特征的基音、共振峰频点;将前256个频点划分为16个语音频段;根据频点的有效性判断是语音帧还是静音帧,如果有效则认为当前是有人说话的语音帧,如果无效则视为无人说话的静音帧;对于语音帧执行增益的自动调整算法,对于静音帧执行非人声噪声幅度计算算法,以得到第三信号;将第三信号通过快速傅立叶逆变换转回时域以得到第四信号;根据第四信号通过DAC电路输出语音。本发明避免了在增强人声信号的同时,放大了背景噪声的问题。 | ||
搜索关键词: | 语音 信号 自动增益控制 方法 | ||
【主权项】:
一种语音信号自动增益控制方法,其特征在于,包括:获得来自麦克风的语音信号;将所述语音信号进行时域预处理,以得到第一信号;将所述第一信号从时域向频域变换,以得到第二信号;从所述第二信号中提取出描述人声特征的基音、共振峰频点;将前256个所述频点划分为16个语音频段;根据所述频点的有效性判断是语音帧还是静音帧,如果有效则认为当前是有人说话的语音帧,如果无效则视为无人说话的静音帧;对于语音帧执行增益的自动调整算法,对于静音帧执行非人声噪声幅度计算算法,以得到第三信号;将所述第三信号通过快速傅立叶逆变换转回时域以得到第四信号;根据所述第四信号通过DAC电路输出语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳北斗卫星信息科技有限公司,未经深圳北斗卫星信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710181857.1/,转载请声明来源钻瓜专利网。
- 上一篇:用于改进含噪语音识别的动态声学模型切换
- 下一篇:一种调整视频的方法及终端