[发明专利]基于双谱加权空间相关矩阵的语音声源定位方法在审

专利信息
申请号: 201510937548.3 申请日: 2015-12-15
公开(公告)号: CN105609113A 公开(公告)日: 2016-05-25
发明(设计)人: 刘文举;雪巍;梁山 申请(专利权)人: 中国科学院自动化研究所
主分类号: G10L21/0216 分类号: G10L21/0216;G10L21/0308;G01S3/808;G01S5/20
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 吕雁葭
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 加权 空间 相关 矩阵 语音 声源 定位 方法
【说明书】:

技术领域

发明涉及基于麦克风阵列的噪声鲁棒语音声源定位方法设计,更 具体地,涉及基于双谱加权空间相关矩阵的语音声源定位方法。

背景技术

基于麦克风阵列语音声源定位方法近年来得到了广泛的研究。通过 不同空间位置的麦克风所采集声音信号,根据声音信号的时间差异信息 和麦克风阵列几何形状,可以最终确定声源方位。时间差异信息的估计 对声源定位算法的性能具有决定性的作用。噪声是语音声源定位方法实 用化的主要制约因素。实际环境下的噪声包括无方向性的散射噪声,以 及有向干扰源噪声。

现有的基于麦克风阵列的声源定位算法均基于同样的框架:首先预 设声源方位候选集合,然后计算对应于各个候选方位的“代价函数”得 分,最终将代价函数得分最高的方位作为最终的声源方位估计。当无向 散射噪声较强时,各个麦克风信号之间的时间差异信息受到无向噪声淹 没,造成声源方位代价函数的空间方位区分度下降;当环境中存在有向 干扰噪声时,声源方位代价函数倾向于将最大峰值指向信号能量最大的 方向,而不能有效区分语音和干扰噪音。

传统声源定位方法主要分为基于高分辨率空间谱估计的方法、基于 可控功率响应的方法、基于时延估计的方法。

基于高分辨率空间谱估计的方法主要源于上个世纪在军事、通信领 域的声呐、雷达等应用中的窄带信号入射角估计问题。该类方法对阵列 空间相关矩阵进行子空间分解,利用信号子空间和噪声子空间的正交性 质,构造特定的声源方位代价函数,使得其在声源方位具有理论上为正 无穷的尖锐峰值。由于该类方法是从窄带信号的简单推广,且多数算法 并不完全针对语音源的定位问题,因此并未将语音的自身特性(如谐波 特性、非平稳特性等)融合到算法的设计中。由于语音频谱分布特性和 窄带信号、宽带平稳信号均不相同,因此许多算法不能完美地适用于语 音声源定位。

基于可控功率响应的方法首先设计波束形成器,以增强特定方向的 目标信号,同时抑制其他方向的非目标信号,然后对所有候选声源方位 进行上述波束扫描,将该候选方位增强后的信号能量,作为对应于该候 选声源方位的代价函数得分。最终,将对应于最大输出信号能量的方向 作为当前声源方位估计。基于可控功率响应的方法的一个重要假设是在 语音声源方位,波束形成器的输出最大。然而,实际环境中,特别是有 向干扰源噪声存在的条件下,该假设并不能有效成立。如何提高在噪声 环境下的性能是该类算法所面临的主要问题。

基于时延估计的方法分为两大步骤。首先,需要根据所观测到的多 路信号,估计各路之间的时间延迟,然后,根据时延估计,以及麦克风 阵列的几何形状,进一步计算声源方位。和基于高分辨率空间谱估计的 方法、基于可控响应功率的方法相比,该类方法计算复杂度较低,实现 简单,因此受到广泛的重视。当信号的采样率较低时,由于只能估计信 号间整数采样点的时间延迟,因此基于时延估计的方法不能达到较高的 角度分辨率。噪声仍是该类方法所面临的主要挑战之一。尤其在有向噪 声存在时,目标信号之间的时延信息极易受到有向噪声时延干扰。

发明内容

为了解决现有技术的问题,本发明的目的在于同时提高在无向和有 向噪声环境下的语音声源定位性能。为达成所属目的,本发明提供一种 基于双谱加权空间相关矩阵的语音声源定位方法。该方法的具体步骤如 下:

步骤a:通过麦克风阵列采集带噪声的多路语音信号,把各路带噪语 音信号分别分帧,在每一帧上计算各路时域信号与第一路麦克风信号之 间的互双谱值;

步骤b:在双谱域上,计算各路麦克风与第一路麦克风之间的双谱相 位差;

步骤c:在双谱域上,利用第一路麦克风信号与自身的互双谱值估计 双谱单元权重;

步骤d:定义候选方位集合;

步骤e:根据双谱相位差和双谱单元权重,构造针对当前候选方位的 双谱加权空间相关矩阵;

步骤f:基于双谱加权空间相关矩阵特征值,计算针对当前候选方位 的声源方位代价函数;

步骤g:重复步骤e~步骤f,直到遍历候选方位集合。根据声源方位 代价函数最大值所对应的方位,得到语音声源方位的估计。

步骤a包括特别地使用直接的双谱估计法或间接的双谱估计法,通过 各路麦克风所接收到的数字观测信号,计算各路时域信号与第一路麦克 风信号之间的原始互双谱值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510937548.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top