[发明专利]一种基于固定波束形成的声源定位和语音增强方法及系统有效
申请号: | 201910845095.X | 申请日: | 2019-09-07 |
公开(公告)号: | CN110534126B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 刘富春;杨洋;林其光 | 申请(专利权)人: | 广州智伴人工智能科技有限公司;华南理工大学 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0264;G10L25/51;G01S5/20 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 江裕强 |
地址: | 510300 广东省广州市海珠区广州大*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于固定波束形成的声源定位和语音增强方法及系统。所述系统包括:数据采集模块、基于最大可控响应功率的声源定位模块和语音增强模块;数据采集模块包括音频文件解析模块和麦克风驱动模块;基于最大可控响应功率的声源定位模块包括子带时延的波束形成器、最大可控响应功率计算模块和最大可控响应功率搜索模块;数据采集模块采集的音频信息流传送给基于最大可控响应功率的声源定位模块,基于最大可控响应功率的声源定位模块输出声源位置估计方向给语音增强模块,语音增强模块以声源位置估计方向为核心,通过波束形成实现语音增强,得到声源位置信息;本发明解决了为智能终端提供支持的声源定位和语音增强的关键技术问题。 | ||
搜索关键词: | 一种 基于 固定 波束 形成 声源 定位 语音 增强 方法 系统 | ||
【主权项】:
1.一种基于固定波束形成的声源定位和语音增强系统,其特征在于,包括:数据采集模块、基于最大可控响应功率的声源定位模块和语音增强模块;所述数据采集模块包括音频文件解析模块和麦克风驱动模块;所述基于最大可控响应功率的声源定位模块,包括子带时延的波束形成器、最大可控响应功率计算模块和最大可控响应功率搜索模块;/n所述音频文件解析模块用于把从M个音频文件中解析出的音频信息流传送给子带时延的波束形成器,麦克风驱动模块用于把含有M个麦克风的麦克风阵列实时采集的音频信息流传送给子带时延的波束形成器;/n所述子带时延的波束形成器接收数据采集模块产生的音频信息流,根据特定波束方向,对音频信息流中的每一帧音频数据进行延迟-求和波束形成,在特定波束方向形成波束并将其传送给最大可控响应功率计算模块,输出该特定波束方向的可控响应功率;最大可控响应功率搜索模块从最大可控响应功率计算模块输出的不同波束方向的可控响应功率中寻找全局最大值,并输出其对应波束方向作为声源位置估计方向,其中声源定位在寻找可控响应功率全局最大值步骤中得到实现;/n所述语音增强模块为波束形成器,最大可控响应功率搜索模块生成的声源位置估计方向发送到语音增强模块,语音增强模块通过延迟-求和波束形成,在声源位置估计方向形成波束,输出增强的语音信号,实现语音增强。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州智伴人工智能科技有限公司;华南理工大学,未经广州智伴人工智能科技有限公司;华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910845095.X/,转载请声明来源钻瓜专利网。