[发明专利]一种基于无线定位麦克风阵列语音增强的通话系统及方法无效
申请号: | 201310513373.4 | 申请日: | 2013-10-25 |
公开(公告)号: | CN103544959A | 公开(公告)日: | 2014-01-29 |
发明(设计)人: | 张军;陈典铖;冯义志;宁更新;季飞;余华;陈芳炯;韦岗 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0332 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 511400 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 无线 定位 麦克风 阵列 语音 增强 通话 系统 方法 | ||
技术领域
本发明涉及语音信号处理领域,特别是一种基于无线定位的麦克风阵列语音增强的通话系统及方法。
背景技术
如何有效地提高噪声环境下语音的通信质量是语音处理中的一个难题。在实际应用环境中,麦克风在拾取语音信号时,会受到背景噪音、混响、其他说话人话音等信号的干扰。这些干扰和噪声会显著降低拾取语音信号的质量和可懂度,从而导致语音通信系统性能的退化。因此,在许多通话应用中都需要进行有效的语音增强处理,以抑制噪声、改善语音质量、提高语音清晰度、可懂度和舒适度。
目前语音增强方法主要包括两类,一类是基于单麦克风的语音增强方法,包括谱减法、维纳滤波、MMSE、卡尔曼滤波、小波变换等,这类方法利用单麦克风接收语音信号,通过时域、频域、小波变换域等滤波和处理来抑制噪声,但由于只利用了一维的语音信号,因此其降噪效果具有较大的局限。另一类是基于麦克风阵列的语音增强方法,这类方法将阵列信号处理技术应用到语音增强中,利用多个麦克风接收到的语音信号里包含的空间相位信息对输入语音进行空间滤波,形成具有指向性的空间波束对指定方向上的语音信号进行增强,同时抑制其他方向上的干扰,具有灵活的波束控制、较高的空间分辨率、较高的信号增益与较强的抗干扰能力等优点,可提供比单麦克风语音增强方法更好的噪声抑制效果,在实际中得到越来越广泛的使用。
通常情况下,使用麦克风阵列进行波束形成之前需要确定波束的指向,即信号的来波方向,现有的来波方向估计主要依赖阵列中的各个麦克风接收到的语音信号来进行,这种方法在一些声学环境较为复杂的通话应用中,特别是在多音源并发、音源快速移动、噪音干扰大等场景时,例如可视通话手机、车载免提电话、多媒体教室、视频会议、智能电视等,存在着以下不足:
(1)现有的麦克风阵列语音增强方法大多是假设单一音源,当多音源并发时,容易引起来波方向角估计误判,令语音增强性能显著下降;
(2)现有的麦克风阵列语音增强方法对来波方向估计通常需要采用迭代的方法,实时调整速度有限,当期望音源快速移动时,来波方向估计可能会滞后或模糊,导致波束形成效果下降;
(3)当采用近场波束形成对语音信号进行幅度补偿时,现有技术较难获知音源与阵元间的准确距离,因而影响近场波束的效果和语音增强性能。
随着无线定位技术的发展,近年来出现了多种无线定位新技术,使得近距离三维高精度无线定位成为可能。例如,目前的超宽带(Ultra Wide Band,UWB)无线定位技术能提供最高达10-6米的定位精度。与基于音频的定位相比,超宽带无线定位具有精度高、不受声学噪声影响、速度快等优点,为解决目前语音通话系统中麦克风阵列语音增强的来波方向估计的不足提供良好的技术基础。
发明内容
针对现有麦克风阵列语音增强中来波方向估计技术在实际通话系统中应用时存在的局限,本发明提供了一种基于无线定位麦克风阵列语音增强的通话系统及方法,首先采用无线定位技术来对目标声源进行定位,再对目标说话人的语音采用麦克风阵列进行语音增强处理及通信,具有定位快速准确、增强效果好、鲁棒性高等优点,能有效提高现有通话系统的语音质量。本发明还提供了实现上述无线定位麦克风阵列语音增强通话方法的通话系统,该系统使用方便、抗干扰性能强。本发明可以广泛应用于可视通话手机、车载免提电话、多媒体教室、视频会议、智能电视等多种场合。
本发明提供的基于无线定位的麦克风阵列语音增强的通话系统,由无线定位发射模块、无线定位接收模块、麦克风阵列语音接收模块、语音增强模块、远端语音播放模块、通信模块共同构成,其中无线定位发射模块与无线定位接收模块采用无线的方式连接,无线定位接收模块和麦克风阵列语音接收模块分别与语音增强模块连接,语音增强模块与通信模块连接,远端语音播放模块与通信模块连接。无线定位发射模块的安装位置与说话人口的位置具有固定的坐标关系,用于发射无线定位信号;无线定位接收模块用于接收无线定位发射模块的定位信号,完成对无线定位发射模块的坐标定位;麦克风阵列语音接收模块中各阵元的位置与无线定位接收模块的位置具有固定的坐标关系,用于完成多路语音信号的接收;语音增强模块完成无线坐标和声学坐标的转换,并采用波束形成技术来完成目标说话人语音的增强;远端语音播放模块用于播放远端通话方的语音;通信模块将语音增强模块输出的语音编码调制后发送给远端通话方,接收远端通话方的语音数据并送至远端语音播放模块进行播放。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310513373.4/2.html,转载请声明来源钻瓜专利网。