[发明专利]一种双声源的声音信号分离方法和拾音器有效

申请号：	202010251574.1	申请日：	2020-04-01
公开（公告）号：	CN111429939B	公开（公告）日：	2023-06-09
发明（设计）人：	黄海;刘佳;隆弢	申请（专利权）人：	西安声联科技有限公司
主分类号：	G10L21/028	分类号：	G10L21/028
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	张秀程
地址：	710077 陕西省西安市高新区丈八***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种双声声音信号分离方法拾音器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种双声源的声音信号分离方法，其特征在于，包括：

接收来自第一声源和第二声源的混合声音信号；

将接收的混合声音信号划分为预设帧长的语音帧，对每一语音帧进行传播方向判断，确定每一语音帧对应的传播方向；

根据各语音帧对应的传播方向分离出来自所述第一声源的声音信号和来自所述第二声源的声音信号；

其中，所述将接收的混合声音信号划分为预设帧长的语音帧，对每一语音帧进行传播方向判断，确定每一语音帧对应的传播方向，包括：

将接收的混合声音信号划分为所述预设帧长的语音帧；

根据接收所述混合声音信号的麦克风阵列中阵元的位置，确定不同阵元组合对应的最大时延差，获取最大时延差大于预设阈值的阵元组合，作为选定阵元组合；

对各语音帧中任一目标语音帧，通过广义互相关函数，确定每一选定阵元组合接收所述目标语音帧的时延差，根据每一选定阵元组合接收所述目标语音帧的时延差，确定所述目标语音帧的传播方向；

其中，阵元组合为麦克风阵列中任意两个麦克风阵元的组合；相邻的语音帧之间存在重叠时间。

2.根据权利要求1所述的双声源的声音信号分离方法，其特征在于，所述根据接收所述混合声音信号的麦克风阵列中阵元的位置，确定不同阵元组合对应的最大时延差，获取最大时延差大于预设阈值的阵元组合，作为选定阵元组合，包括：

根据公式确定所述麦克风阵列中不同阵元组合对应的最大时延差，获取最大的三个最大时延差所对应的阵元组合，作为选定阵元组合；

其中，为由麦克风阵元i和麦克风阵元j组成的阵元组合对应的最大时延差，d_ij为在麦克风阵列中麦克风阵元i和麦克风阵元j之间的距离，c＝340m/s为声速，f_s＝16kHz为采样频率，表示向上取整。

3.根据权利要求2所述的双声源的声音信号分离方法，其特征在于，所述对各语音帧中任一目标语音帧，通过广义互相关函数，确定每一选定阵元组合接收所述目标语音帧的时延差，根据每一选定阵元组合接收所述目标语音帧的时延差，确定所述目标语音帧的传播方向，包括：

将最大时延差相同的选定阵元组合划分在同一分组中；

通过广义互相关函数，确定每一选定阵元组合接收所述目标语音帧的时延差，根据每一选定阵元组合接收所述目标语音帧的时延差，计算每一分组中选定阵元组合的时延差的平均值，作为分组时延差；

根据每一分组的分组时延差和每一分组的设定判断标准判断所述目标语音帧传播方向。

4.根据权利要求3所述的双声源的声音信号分离方法，其特征在于，所述根据每一分组的分组时延差和每一分组的设定判断标准判断所述目标语音帧传播方向，包括：

对任一分组，统计所述分组中，分组时延差小于所述分组的设定判断标准的第一数量，以及分组时延差大于所述分组的设定判断标准的第二数量；

若所述第一数量大于所述第二数量，则所述目标语音帧的传播方向为第一方向，若所述第一数量小于所述第二数量，所述目标语音帧的传播方向为第二方向。

5.根据权利要求1所述的双声源的声音信号分离方法，其特征在于，所述对各语音帧中任一目标语音帧，通过广义互相关函数，确定每一选定阵元组合接收所述目标语音帧的时延差，包括：

对各语音帧中任一目标语音帧，通过公式和计算每一选定阵元组合接收所述目标语音帧的时延差；

其中，表示选定阵元组合中的麦克风阵元i和麦克风阵元j接收所述目标语音帧的时延差，X_i(ω_k')和分别表示麦克风阵元i和麦克风阵元j接收到的声音信号的频谱，表示对X_i(ω_k')和进行快速傅里叶变换后的结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安声联科技有限公司，未经西安声联科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010251574.1/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载