[发明专利]语音声源方向估计方法及装置有效
申请号: | 201610656669.5 | 申请日: | 2016-08-11 |
公开(公告)号: | CN106251877B | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 谢宜昊 | 申请(专利权)人: | 珠海全志科技股份有限公司 |
主分类号: | G10L19/032 | 分类号: | G10L19/032;G10L21/0216;G10L21/0232 |
代理公司: | 珠海智专专利商标代理有限公司 44262 | 代理人: | 林永协 |
地址: | 519085 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种语音声源方向估计方法及装置,该方法包括:声源获取步骤,获取麦克风阵列实时收集的音频数据;频带分解步骤,将每一个麦克风通道所收集的当前帧音频数据分解成预设数量的频带信号,将所有麦克风通道同一时刻的频带信号组成频带信号向量;频带估计步骤,对频带信号向量进行分析,获得当前帧音频数据相同时刻的频带信号向量的波达方向估计向量;数据关联步骤,根据波达方向估计向量进行数据关联,得到当前帧音频数据的最终备选方向估计向量;波达方向跟踪步骤,对最终备选方向估计向量在时域中进行平滑处理,并获得当前帧音频数据的语音声源波达方向。该装置为该方法提供应用模块。本发明可增强语音,且语音方向估计更加精确。 | ||
搜索关键词: | 语音 声源 方向 估计 方法 装置 | ||
【主权项】:
1.语音声源方向估计方法,其特征在于:包括:声源获取步骤,获取麦克风阵列实时收集的音频数据;频带分解步骤,将每一个麦克风通道所收集的当前帧所述音频数据分解成预设数量的频带信号,将所有所述麦克风通道同一时刻的所述频带信号组成频带信号向量;频带估计步骤,对所述频带信号向量进行分析,获得当前帧所述音频数据相同时刻的所述频带信号向量的波达方向估计向量;数据关联步骤,根据所述波达方向估计向量进行数据关联,得到当前帧所述音频数据的最终备选方向估计向量;波达方向跟踪步骤,对所述最终备选方向估计向量在时域中进行平滑处理,并获得当前帧所述音频数据的语音声源波达方向。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海全志科技股份有限公司,未经珠海全志科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610656669.5/,转载请声明来源钻瓜专利网。
- 上一篇:基于HOOK技术的音效混合方法与系统
- 下一篇:会务语音录入设备