[发明专利]麦克风信号处理方法、装置、设备及存储介质有效
申请号: | 201910324799.2 | 申请日: | 2019-04-22 |
公开(公告)号: | CN110310655B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 刘荣 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/78;G10L15/28 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 张金福 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 麦克风 信号 处理 方法 装置 设备 存储 介质 | ||
本发明提供一种麦克风信号处理方法、装置、设备及存储介质,进行线性回声消除处理和波束形成处理后信号一分为三,一路通过第一降噪处理后进行第一非线性回声抑制处理,然后进行语音存在检测,得到语音存在检测结果X;第二路经过第二降噪处理后进行第一自动增益控制处理,得到供语音识别用的语音识别信号Y;X和Y合并成两个声道,提供给语音识别APP使用;第三路经过第三降噪处理后进行第二非线性回声抑制处理,进一步抑制残留回声,然后进行第二自动增益控制处理,得到语音应用信号Z,供录音或通信APP使用。本发明针对语音识别APP和其他语音APP的不同需求,将信号分支成三路,结构灵活,可以单独调整两部分信号处理的参数和算法,不互相影响。
技术领域
本发明涉及语音信号处理领域,更具体地,涉及一种麦克风信号处理方法、装置、设备及存储介质。
背景技术
在语音识别应用中,需要对麦克风信号做一些前处理,例如波束形成(Beamforming)、回声消除(AEC)、降噪(NR)、自动增益控制(AGC)、去混响(DR)、语音存在检测(VAD)等。在操作系统中,语音识别的软件通常是一个通用的APP,它会直接从声卡设备获取语音信号并进行识别,而波束形成、回声消除、去混响等是和硬件设计高度相关的,不好单独放在应用软件中,且每个应用软件都要独立实现,重复计算,有些信息甚至获取不到,通用性差。因此现有的技术方案有些是在麦克风模块的固件中实现,其缺点是:运算量大,模块成本高。或在驱动中实现,其缺点:资源受限,例如浮点运算、锁、任务调度、休眠等。
发明内容
本发明为解决现有技术存在的问题,提供一种麦克风信号处理方法、装置、设备及存储介质,针对语音识别APP和其他语音APP的不同需求,将信号分支成多路处理,可以单独调整每部分信号处理的参数和算法,不互相影响。
第一方面,本发明实施例提供一种麦克风信号处理方法,包括以下步骤:
S1:多路麦克风信号和参考信号一起进行线性回声消除处理(AEC),将麦克风中拾取到的扬声器声音抵消掉;
S2:线性回声消除处理后的多路麦克风信号进行波束形成(Beamforming)处理,波束形成的信号一分为三,
其中一路信号通过第一降噪处理后进行第一非线性回声抑制处理,进一步抑制残留回声,然后进行语音存在检测(VAD),得到语音存在检测结果X;
第二路信号经过第二降噪处理后进行第一自动增益控制(AGC)处理,得到供语音识别用的语音识别信号Y;
语音存在检测结果X和语音识别信号Y合并成两个声道,提供给语音识别APP使用;
这里使通过两个不同的第一降噪算法和第二降噪算法,是因为用于语音识别的语音信号,如果降噪太厉害或处理不好的话,会严重影响识别率;而VAD检测的降噪则需要比较强力的降噪,否则会影响VAD的正常工作。而非线性回声抑制部分,只在VAD通道上做的原因也是因为它会影响语音识别率,但对VAD检测很有帮助;这样分开两路处理后,既能保证语音识别的效果,又能保证VAD的效果,而且调试和优化也更方便,参数不会互相耦合。
第三路信号经过第三降噪处理后进行第二非线性回声抑制处理,进一步抑制残留回声,然后进行第二自动增益控制处理,得到语音应用信号Z,供录音或通信APP使用。
优选地,步骤S1中,所述参考信号从扬声器上获取到,或者从声卡驱动/语音播放软件中获取。
优选地,步骤S1中,使用自适应滤波器对各路麦克风信号和参考信号一起进行线性回声消除处理。
优选地,步骤S2中,多路麦克风信号进行波束形成处理时,需要知道波达角度(DOA),波达角度根据预设的波达角度估计方法计算得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910324799.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:回声消除方法及装置、电子设备、可读存储介质
- 下一篇:一种语音增强方法