[发明专利]基于麦克风阵列的声源跟踪与拾音的方法和装置在审
申请号: | 201910440423.8 | 申请日: | 2019-05-24 |
公开(公告)号: | CN111986692A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 范展;简小征;姜开宇;李傲 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 孙之刚;刘春元 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 麦克风 阵列 声源 跟踪 方法 装置 | ||
本文描述了基于麦克风阵列的声源跟踪和拾音的方法和装置。方法包括:基于麦克风阵列接收到的快拍数据估计瞬时声源方位;计算在所估计的瞬时声源方位上语音信号能量的空间谱散度;基于计算出的空间谱散度检测语音活动;在检测到语音活动时,基于所估计的瞬时声源方位更新声源方位。
技术领域
本公开涉及麦克风阵列的技术领域,具体地涉及基于麦克风阵列的声源跟踪与拾音的方法和装置。
背景技术
近年来,随着计算机技术的快速发展,人们希望在更远距离、更复杂的环境下控制智能设备,传统近场语音技术已经无法满足应用需求。因此,智能语音技术特别是基于麦克风阵列的远场拾音技逐步成为当前的研究热点。而双麦克风阵列凭借与多麦克风阵列相比成本更低、安装使用灵活、功耗低等优点成为诸如智能电视、智能音箱、移动机器人等消费类电子产品的优选方案。
波束形成是麦克风阵列的核心技术,它通过对采集的阵列数据进行加权求和来保护期望方向的信号,同时抑制其他方向的噪声与干扰,以达到远场(通常指的是1米以外)拾音的目的。波束形成通常分为两种类型:一种类型是数据不依赖型波束形成,如延时相加法、固定求和法等,这类方法对空间强干扰源的抑制效果往往不够理想。另一种类型是数据依赖波束形成,如自适应波束形成法、自适应旁瓣对消法等,它们的加权系数可以根据外部环境的变化自适应调整,以达到抑制强干扰源的目的,这种类型的波束形成对基阵模型误差非常敏感。
在移动机器人、智能家居等应用场景中,声源很可能是在运动的,因此声源相对于麦克风的位置往往会发生变化。现有自适应波束形成算法对方向偏差非常敏感,尤其是在观测数据中包含期望信号分量时,即使很小的方向偏差也容易使主瓣波束图畸变,进而使期望信号被抵消。
发明内容
有鉴于此,本公开提供了一种基于麦克风阵列的跟踪声源和拾音方法。
根据本公开的第一方面,提供了一种基于麦克风阵列的声源跟踪和拾音方法,包括:基于麦克风阵列接收到的快拍数据估计瞬时声源方位;计算在所估计的瞬时声源方位上语音信号能量的空间谱散度;基于计算出的空间谱散度检测语音活动;在检测到语音活动时,基于所估计的瞬时声源方位更新声源方位。
在一些实施例中,估计瞬时声源方位还包括:采用最大似然估计法基于麦克风阵列在一时间段内接收到的N个快拍数据在麦克风阵列的工作频带上估计瞬时声源方位,N为正整数。
在一些实施例中,采用最大似然估计法还包括:构造关于观测方位和麦克风阵列的工作频带的各个子频带的中心频率的似然函数,其中是麦克风阵列的阵元的序号m=0、1,为第个阵元接收到的快拍数据,c为声波在空气中的传播速度,为麦克风阵列的阵元间距,观测方位是针对观测区间的一组离散观测方位序列。
在一些实施例中,计算空间谱散度还包括:构造所述瞬时声源方位的函数,以计算在所述瞬时声源方位上语音信号能量的空间谱散度,其中是针对观测区间的一组离散观测方位,为语音信号在观测方位的空间谱函数。
在一些实施例中,检测语音活动还包括:比较计算出的空间谱散度与预定检测门限以判断是否检测到语音活动。
在一些实施例中,在空间谱散度大于检测门限时,判定检测到所述语音活动;以及在空间谱散度小于检测门限时,判定未检测到语音活动。
在一些实施例中,更新声源方位还包括:按照下式执行所述更新:,其中是常数,表示前一声源方向。
在一些实施例中,该方法还包括基于更新后的声源方位计算麦克风阵列的自适应波束形成加权系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910440423.8/2.html,转载请声明来源钻瓜专利网。