[发明专利]用于语音识别前端的频域回声消除方法及计算机储存介质在审
申请号: | 201811533955.8 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109727604A | 公开(公告)日: | 2019-05-07 |
发明(设计)人: | 胡奎 | 申请(专利权)人: | 上海蔚来汽车有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0232;G10L15/22 |
代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 陈超 |
地址: | 201804 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 回声消除 回声 互相关系数 语音识别 频域 计算机储存介质 非线性处理 残差信号 回声信号 频域信号 时域信号 应用场景 增益函数 子带信号 单通道 功率谱 运算量 收敛 估算 输出 | ||
一种用于语音识别前端的回声消除方法和系统,该回声消除方法主要包括时‑频域信号变换、回声信号与残差信号估算、子带信号功率谱与互相关系数计算、基于互相关系数的增益函数进行非线性处理以及频‑时域信号变换等步骤,最终输出已消除回声的信号。本发明使用单通道回声消除方法处理车载或其他应用场景回声中的频域回声,具有运算量小且收敛速度快的特点。
技术领域
本发明涉及人工智能领域的语音信号预处理领域无人飞行器领域,具体涉及一种用于语音识别前端的频域回声消除方法、计算机存储介质和电子设备。
背景技术
声学回声(acoustic echo)是指在进行语音通话或语音播放等场景讲话者的语音返回而再次被听到的现象。讲话者使用的扬声器的声音通过麦克风再次被输入而产生声学回声,且声学回声成为在语音通话、播放或多方语音会议等时音质降低的主要原因。因此,大部分的语音通话、播放或者语音会议方案使用声学回声消除器(AEC:Acoustic EchoCanceller)。
车载应用场景中由于往往有多个扬声器,需要用到多通道回声消除算法以便于去除来自多个扬声器的参考回声。现有的处理方法往往是分别用一个自适应滤波器去估计回声路径,分别将各参考回声去除掉。然而使用多通道回声消除方法处理车载音乐回声的问题主要有运算量大与收敛速度慢的缺点。
发明内容
基于上述问题,本文提出一种用于语音识别前端的频域回声消除方法和系统,使用单通道回声消除方法处理车载或其他应用场景回声中的频域回声,具有运算量小且收敛速度快的特点。
本发明的第一方面提供了一种用于语音识别前端的频域回声消除方法,包括:
采集参考信号x(n)和麦克风信号d(n),所述参考信号为扬声器的播放信号,所述麦克风信号包括回声信号y(n)和语音信号s(n),其中n是信号序列采样点编号;
对所述参考信号x(n)和麦克风信号d(n)进行分帧,得到分帧后的时域信号(即参考信号分帧信号)与(即麦克风信号分帧信号),其中m为分帧后的帧号。然后对分帧信号进行时-频域信号变换,得到第m帧频域下的参考信号子带信号Xk(m)和麦克风信号子带信号Dk(m);其中,k=0,1,2,…,(K-1),K;K为频域信号子带数,m分帧后的帧号,麦克风信号d(n)与参考信号x(n)分别经过时频域变换之后得到频域的下采样之后的子带信号:Dk(m)与·Xk(m);
对所述参考信号子带信号进行滤波得到回声信号的估计信号,将所述麦克风信号子带信号与所述回声信号的估计信号相减得到残差信号子带信号;
计算所述参考信号子带信号Xk(m)和麦克风信号子带信号Dk(m)的功率谱及两者的互功率谱,以求出两者的互相关系数;
基于所述互相关系数产生的增益函数对所述残差信号子带信号作非线性处理,得到去除回声的子带信号Eout,k(m);
对所述去除回声的子带信号进行频-时域信号变换,作为最终的回声消除信号输出。
在一些实施例中,使用FFT,WOLA滤波器组或其它滤波器组对所述参考信号分帧信号和麦克风信号分帧信号进行时-频域信号变换。
在一些实施例中,使用双滤波器对所述参考信号子带信号进行滤波得到回声信号的估计信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蔚来汽车有限公司,未经上海蔚来汽车有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811533955.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音处理方法、装置、用户设备及存储介质
- 下一篇:处理声音信号的方法及系统