[发明专利]用于可变噪声状况中语音增强的鲁棒噪声估计在审
申请号: | 201780055338.9 | 申请日: | 2017-09-09 |
公开(公告)号: | CN109643552A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 宋建鸣;B.乔希 | 申请(专利权)人: | 大陆汽车系统公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/84;G10L25/12 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 黄涛;申屠伟进 |
地址: | 美国密*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪声 系数集合 预先存储 语音 线性预测系数 机动车辆中 可变噪声 使用模式 语音增强 噪声估计 噪声信号 鲁棒 瞬态 匹配 静止 集合 改进 | ||
1.一种通过在可变噪声状况中识别和估计噪声来去除嵌入的声学噪声并增强语音的方法,所述方法包括:
使用语音/噪声分类器生成多个线性预测编码系数集合,所述线性预测编码系数集合利用高阶LPC和低阶LPC对传入的信号帧进行建模;
使用语音/噪声分类器计算从所述信号帧得到的高阶和低阶LPC之间的对数频谱距离,其中所述对数频谱距离通过从高阶和低阶LPC系数集合导出的两个倒谱系数集合计算;
使用语音/噪声分类器比较所述距离及其短时间轨迹与阈值的集合,以确定所述信号帧是语音还是噪声,其中基于分类统计和/或与其他嗓音活动检测方法协商来更新用于语音/噪声分类器的所述阈值;
生成多个线性预测编码(LPC)系数集合作为在运行时在线创建的噪声模型,每个LPC系数集合表示对应的噪声,其中在当前信号帧按照语音存在的概率和由LPC语音/噪声分类器中的至少一项分类为噪声的状况下创建和更新所述噪声模型;
使用基于以下操作的分离但并行的语音/噪声分类器:评估输入信号的LPC系数相对于由LPC系数集合表示的噪声模型的距离;
如果评估的距离低于阈值,则将信号分类为噪声,否则将信号分类为语音;
当环境噪声是静止的时,使用利用语音存在的概率来实施噪声去除的噪声抑制方法;
在环境噪声是瞬态或非静止的时使用第二噪声抑制器,第二噪声抑制器包括基于LPC的噪声/语音分类用于增强噪声估计和噪声衰减;
其中,只要常规噪声估计不足,由第二噪声抑制器进行的噪声估计计及语音存在的概率并且相应地适配频域中的噪声PSD;以及
使用来自增强的噪声分类/估计的重新计算的噪声PSD来在频域中生成改良的噪声抑制增益的集合。
2.一种装置,包括:
线性预测编码嗓音活动检测器,被配置为:
对输入信号进行低通滤波;
对输入信号的高频内容应用预加强,以便加强经低通滤波的输入信号的高频频谱结构;
计算预加强的经低通滤波的输入信号的自动关联的序列;
应用第一高阶线性预测编码(“LPC”)分析并计算较长的LPC系数集合;
应用第二高阶LPC分析并计算较短的LPC系数集合;
将较长的LPC系数集合和较短的LPC系数集合投射到频谱域;
对较长的LPC系数集合和较短的LPC系数集合的频谱域表示进行能量归一化;
确定较长的LPC系数集合与较短的LPC系数集合的经能量归一化的频谱域表示之间的对数频谱距离;
基于较长的LPC系数集合与较短的LPC系数集合的经能量归一化的频谱域表示之间的所确定的对数频谱距离是否小于噪声阈值,确定输入信号帧是否为噪声;以及
当确定输入信号帧不是噪声时,基于较长的LPC系数集合与较短的LPC系数集合的经能量归一化的频谱域表示之间的所确定的对数频谱距离是否大于语音阈值来确定输入信号帧是否是语音。
3.如权利要求2所述的装置,其中,所述低通滤波器的截止频率为3kHz。
4.如权利要求2所述的装置,其中,所述较长的LPC系数集合具有10或更大的阶。
5.如权利要求2所述的装置,其中,所述较短的LPC系数集合具有4或更小的阶。
6.如权利要求2所述的装置,其中,所述对数频谱距离用欧几里德倒谱距离近似,以减少相关的计算负荷。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大陆汽车系统公司,未经大陆汽车系统公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780055338.9/1.html,转载请声明来源钻瓜专利网。