[发明专利]基于统计模型的麦克风阵列语音增强方法有效
申请号: | 201711201341.5 | 申请日: | 2017-11-23 |
公开(公告)号: | CN107993670B | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 张军;邓舒夏;宁更新;冯义志;季飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/26;G10L21/0216;G10L21/0232;G10L21/0272 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 统计 模型 麦克风 阵列 语音 增强 方法 | ||
本发明公开了基于统计模型的麦克风阵列语音增强方法。该方法先建立用于语音帧分类的干净语音模型,并计算出对应于每个分类的干净语音线性频谱模型;将麦克风阵列接收的信号分为两条支路,主支路采用GSC的固定波束形成器对期望方向的信号进行增强,得到初步增强的语音yc,辅助支路通过GSC的阻塞矩阵和自适应抵消器后,得到噪声分量yn;从辅助支路的信号中估计噪声模型及噪声的线性频谱模型;对yc分帧,利用噪声模型和干净语音模型对每帧语音进行分类;根据分类结果,利用干净语音线性频谱模型和噪声的线性频谱模型构造最佳滤波器;用最佳滤波器对yc进行滤波,获得增强后的语音。本发明提高了输出语音的听觉质量,可在具有嘈杂背景的语音通信中应用。
技术领域
本发明涉及语音信号处理领域,特别是一种基于统计模型的麦克风阵列语音增强方法。
背景技术
在实际语音通信中,语音信号常会受到外界环境噪声的干扰,影响接收语音的质量(非干净语音)。语音增强技术是语音信号处理的一个重要分支,目的是从带噪语音中尽可能地提取纯净的原始语音,广泛应用于嘈杂环境下的语音通信、语音压缩编码和语音识别等领域。
常用的语音增强方法包括两大类,一类是基于单麦克风的语音增强方法,另一类是基于麦克风阵列的语音增强方法。常用的单麦克风语音增强方法有谱减法、维纳滤波法、MMSE、卡尔曼滤波、小波变换等,这类算法通过时域、频域、小波变换域等滤波来抑制噪声,但无法利用信号的空间域信息,因此当噪声较强时,单麦克风语音增强算法的重建语音质量不高。
基于麦克风阵列的语音增强方法的基本思想是将一组麦克风按一定的方式布置在空间不同的位置上,用其构成的传感器阵列接收空间的音频信号。由于麦克风阵列语音增强技术可以利用多路接收信号之间的空间相关性,在接收区域内可以检测、定位和追踪声源,增强指定方向的有用语音信号,抑制无用的干扰和噪声,因此与单麦克风相比,麦克风阵列具有更高的信号增益和更强的干扰抑制能力。现有的麦克风阵列语音增强技术可以大致分为固定波束形成法、自适应波束形成法和后置自适应滤波法三类,其中自适应波束形成法中,滤波器系数随着输入信号统计特性的变化而变化,可以使波束的零陷方向自动对准噪声方向,而注视方向上信号的频率响应固定不变,因此能有效抑制其它方向上的干扰噪声,在实际中得到了广泛的应用。
广义旁瓣相消器(GSC)是麦克风阵列自适应波束形成器的一种通用模型,它把受限的线性约束最小方差(LCMV)最优化问题转化为非约束最优化问题,主支路使用固定波束形成器增强期望方向的信号,辅助支路使用空间陷波器来阻塞期望方向上的信号,估计主支路的噪声,并通过自适应抵消器将辅助支路估计的噪声与主支路的噪声抵消,从而最小化系统干扰和噪声输出功率,实现对目标信号的增强。GSC提高了麦克风阵列在时变环境下的适应性,且结构简单,易于实现,广泛用于各种阵列信号处理中。但现有的GSC麦克风阵列语音增强技术还存在以下不足:(1)虽然GSC对空间相干的噪声具有较强的抑制能力,但是对空间非相干噪声的抑制能力不强,特别是在空间非相干的环境噪声与空间相干的噪声并存时,输出的增强语音存在的残余噪声较多;(2)GSC算法是针对一般输入信号设计的,没有利用语音信号的先验知识和针对语音信号的特点进行优化,因此重建语音的质量有待进一步提高。
发明内容
为了改善GSC算法的性能,本发明提供一种基于统计模型的麦克风阵列语音增强方法,该方法利用干净语音模型和从GSC辅助支路输出中估计的噪声模型构造最佳语音滤波器,来对GSC主支路信号进行增强。
本发明的目的至少通过如下技术方案之一实现。
本发明提供的基于统计模型的麦克风阵列语音增强方法,采用以下步骤对输入的语音信号进行增强:
步骤1:使用干净语音库建立用于语音帧分类的干净语音模型,并计算出对应于每个分类的干净语音线性频谱模型。上述干净语音库中的语音使用单麦克风进行采集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711201341.5/2.html,转载请声明来源钻瓜专利网。