[发明专利]一种双声源的声音信号分离方法和拾音器有效

申请号：	202010251574.1	申请日：	2020-04-01
公开（公告）号：	CN111429939B	公开（公告）日：	2023-06-09
发明（设计）人：	黄海;刘佳;隆弢	申请（专利权）人：	西安声联科技有限公司
主分类号：	G10L21/028	分类号：	G10L21/028
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	张秀程
地址：	710077 陕西省西安市高新区丈八***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种双声声音信号分离方法拾音器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种双声源的声音信号分离方法和拾音器，将混合声音信号划分为语音帧，估计语音帧达麦克风阵列中不同阵元组合的时延差，然后根据确定的时延差判断语音帧的传播方向，根据传播方向实时分离出不同声源对应的声音信号并输出。通过广义互相关算法进行时延估计，不仅能够准确的估计时延，而且能够保证算法的运算量较低，使算法在实时系统中能够更准确、高效地跟踪声源方位，从而实现对第一声源和第二声源的声音信号进行自动分离。

技术领域

本发明涉及语音处理技术领域，尤其是涉及一种双声源的声音信号分离方法和拾音器。

背景技术

近年来，随着语音识别技术的飞速发展，多路语音识别场景中对实时声源分离技术提出迫切的技术需求。比如，在某些重要会议场景中，实时会议记录，以及记录质量都有着举足轻重的作用。但就目前实际市场而言，会议记录或是依靠人工现场进行记录和整理；或是先期视频录制再后期回放进行整理。而这两种方式，都是一项非常耗时和繁琐的人力工作。可以通过录音的方式记录声音信号，但是当需要回放某一内容时，需要回放整段录音，耗时较长。

现有技术中也存在对声源定向的技术，但是这些技术普遍存在定位准确度低、实时跟踪性差的问题，此外，声源分离存在切换不及时、语音分离存在误判等问题。

由此，在实际应用过程中，声源分离技术定位准确性低、声源分离存在切换不及时、语音分离存在误判。

发明内容

本发明实施例提供一种双声源的声音信号分离方法和拾音器，用以解决现有技术中的声源分离技术定位准确性低、声源分离存在切换不及时、语音分离存在误判的问题。

针对以上技术问题，第一方面，本发明的实施例提供了一种双声源的声音信号分离方法，包括：

接收来自第一声源和第二声源的混合声音信号；

将接收的混合声音信号划分为预设帧长的语音帧，对每一语音帧进行传播方向判断，确定每一语音帧对应的传播方向；

根据各语音帧对应的传播方向分离出来自所述第一声源的声音信号和来自所述第二声源的声音信号。

第二方面，本发明的实施例提供了本发明的实施例提供了一种声音信号分离装置，包括：

接收模块，用于接收来自第一声源和第二声源的混合声音信号；

处理模块，用于将接收的混合声音信号划分为预设帧长的语音帧，对每一语音帧进行传播方向判断，确定每一语音帧对应的传播方向；

分离模块，用于根据各语音帧对应的传播方向分离出来自所述第一声源的声音信号和来自所述第二声源的声音信号。