[发明专利]基于麦克风阵列的声源跟踪与拾音的方法和装置在审
申请号: | 201910440423.8 | 申请日: | 2019-05-24 |
公开(公告)号: | CN111986692A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 范展;简小征;姜开宇;李傲 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 孙之刚;刘春元 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 麦克风 阵列 声源 跟踪 方法 装置 | ||
1.一种基于麦克风阵列的声源跟踪和拾音方法,包括:
基于所述麦克风阵列接收到的快拍数据估计瞬时声源方位;
计算在所估计的瞬时声源方位上语音信号能量的空间谱散度;
基于计算出的空间谱散度检测语音活动;
在检测到所述语音活动时,基于所估计的瞬时声源方位更新声源方位。
2.根据权利要求1所述的方法,其中所述估计瞬时声源方位还包括:
采用最大似然估计法,基于所述麦克风阵列在一时间段内接收到的N个快拍数据在所述麦克风阵列的工作频带上估计瞬时声源方位,N为正整数。
3.根据权利要求2所述的方法,其中所述采用最大似然估计法还包括:
构造关于观测方位和所述麦克风阵列的工作频带的各个子频带的中心频率的似然函数,其中是所述麦克风阵列的阵元的序号m=0、1,为第个阵元接收到的快拍数据,c为声波在空气中的传播速度,为麦克风阵列的阵元间距,观测方位是针对观测区间的一组离散观测方位。
4.根据权利要求1所述的方法,其中所述计算空间谱散度还包括:
构造所述瞬时声源方位的函数,以计算在所述瞬时声源方位上语音信号能量的空间谱散度,其中是针对观测区间的一组离散观测方位,为语音信号在观测方位的空间谱函数。
5.根据权利要求1所述的方法,其中所述检测语音活动还包括:
比较计算出的空间谱散度与预定检测门限以判断是否检测到语音活动。
6.根据权利要求5所述的方法,其中在空间谱散度大于检测门限时,判定检测到所述语音活动;以及在空间谱散度小于检测门限时,判定未检测到语音活动。
7.根据权利要求1所述的方法,其中所述更新声源方位还包括按照下式执行所述更新:
,其中是常数,表示前一声源方向。
8.根据权利要求1所述的方法,还包括:
基于更新后的声源方位计算麦克风阵列的自适应波束形成加权系数。
9.根据权利要求8所述的方法,所述计算自适应波束形成加权系数还包括:
采用波束图畸变约束法计算自适应波束形成加权系数,其中波束图畸变约束法依次包括:
S101. 构造特征矩阵,通过求解下式的凸优化问题计算的值:
,其中是大于0小于2的常数,代表波束图畸变约束因子,是根据声源方向计算得到的假定导向矢量,为N个有效快拍数据的协方差矩阵;
S102. 判断A的秩,在Rank(A)>1时,根据公式对特征矩阵A进行秩1分解,以估计导向矢量a,以及
在Rank(A)=1时,对矩阵A进行特征值分解以估计导向矢量a;
S103. 以a为导向矢量计算自适应波束形成权系数。
10.根据权利要求2所述的方法,其中所述时间段的长度为25ms。
11.根据前述任一项权利要求所述的方法,其中所述麦克风阵列为双麦克风阵列。
12.一种基于麦克风阵列的声源跟踪和拾音装置,包括:
瞬时声源方位估计模块,被配置为基于所述麦克风阵列接收到的快拍数据估计瞬时声源方位;
空间谱散度计算模块,被配置为计算在所估计的瞬时声源方位上语音信号能量的空间谱散度;
语音活动检测模块,被配置为基于计算出的空间谱散度检测语音活动;
声源方位更新模块,被配置为在检测到所述语音活动时,基于所估计的瞬时声源方位更新声源方位。
13.根据权利要求12所述的装置,其中空间谱散度计算模块被配置为所述计算空间谱散度还包括:
构造所述瞬时声源方位的函数,以计算在所述瞬时声源方位上语音信号能量的空间谱散度,其中是针对观测区间的一组离散观测方位,为语音信号在观测方位的空间谱函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910440423.8/1.html,转载请声明来源钻瓜专利网。