[发明专利]一种双声源的声音信号分离方法和拾音器有效
申请号: | 202010251574.1 | 申请日: | 2020-04-01 |
公开(公告)号: | CN111429939B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 黄海;刘佳;隆弢 | 申请(专利权)人: | 西安声联科技有限公司 |
主分类号: | G10L21/028 | 分类号: | G10L21/028 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张秀程 |
地址: | 710077 陕西省西安市高新区丈八*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 双声 声音 信号 分离 方法 拾音器 | ||
本发明实施例提供了一种双声源的声音信号分离方法和拾音器,将混合声音信号划分为语音帧,估计语音帧达麦克风阵列中不同阵元组合的时延差,然后根据确定的时延差判断语音帧的传播方向,根据传播方向实时分离出不同声源对应的声音信号并输出。通过广义互相关算法进行时延估计,不仅能够准确的估计时延,而且能够保证算法的运算量较低,使算法在实时系统中能够更准确、高效地跟踪声源方位,从而实现对第一声源和第二声源的声音信号进行自动分离。
技术领域
本发明涉及语音处理技术领域,尤其是涉及一种双声源的声音信号分离方法和拾音器。
背景技术
近年来,随着语音识别技术的飞速发展,多路语音识别场景中对实时声源分离技术提出迫切的技术需求。比如,在某些重要会议场景中,实时会议记录,以及记录质量都有着举足轻重的作用。但就目前实际市场而言,会议记录或是依靠人工现场进行记录和整理;或是先期视频录制再后期回放进行整理。而这两种方式,都是一项非常耗时和繁琐的人力工作。可以通过录音的方式记录声音信号,但是当需要回放某一内容时,需要回放整段录音,耗时较长。
现有技术中也存在对声源定向的技术,但是这些技术普遍存在定位准确度低、实时跟踪性差的问题,此外,声源分离存在切换不及时、语音分离存在误判等问题。
由此,在实际应用过程中,声源分离技术定位准确性低、声源分离存在切换不及时、语音分离存在误判。
发明内容
本发明实施例提供一种双声源的声音信号分离方法和拾音器,用以解决现有技术中的声源分离技术定位准确性低、声源分离存在切换不及时、语音分离存在误判的问题。
针对以上技术问题,第一方面,本发明的实施例提供了一种双声源的声音信号分离方法,包括:
接收来自第一声源和第二声源的混合声音信号;
将接收的混合声音信号划分为预设帧长的语音帧,对每一语音帧进行传播方向判断,确定每一语音帧对应的传播方向;
根据各语音帧对应的传播方向分离出来自所述第一声源的声音信号和来自所述第二声源的声音信号。
第二方面,本发明的实施例提供了本发明的实施例提供了一种声音信号分离装置,包括:
接收模块,用于接收来自第一声源和第二声源的混合声音信号;
处理模块,用于将接收的混合声音信号划分为预设帧长的语音帧,对每一语音帧进行传播方向判断,确定每一语音帧对应的传播方向;
分离模块,用于根据各语音帧对应的传播方向分离出来自所述第一声源的声音信号和来自所述第二声源的声音信号。
第三方面,本发明的实施例提供一种拾音器,
包括麦克风阵列单元、处理单元和输出单元;所述麦克风阵列单元包括麦克风阵列和音频编码单元;
所述麦克风阵列单元用于将采集的声音信号发送到处理单元;
所述处理单元用于执行以上任一项所述的双声源的声音信号分离方法,分离出来自所述第一声源的声音信号和来自所述第二声源的声音信号,将来自所述第一声源的声音信号和来自所述第二声源的声音信号分别发送到所述输出单元;
所述输出单元用于分别输出来自所述第一声源的声音信号和来自所述第二声源的声音信号;
其中,所述音频编码单元用于将麦克风阵列接收的声波转化为电信号,得到声音信号。
第四方面,本发明的实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以上所述的双声源的声音信号分离方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安声联科技有限公司,未经西安声联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010251574.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种声音信号记录系统
- 下一篇:一种公路桥梁