[发明专利]分离语音信号的方法、装置及介质有效
申请号: | 202010080829.2 | 申请日: | 2020-02-05 |
公开(公告)号: | CN113223553B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 侯海宁;李炯亮;李晓明 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L19/02 |
代理公司: | 北京名华博信知识产权代理有限公司 11453 | 代理人: | 苗源 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分离 语音 信号 方法 装置 介质 | ||
本公开是关于一种分离语音信号的方法、装置和介质。该方法包括:对待分离的时域混合语音信号进行分帧处理,获取多帧时域子信号;获取时域子信号的频域子信号;设置声源信号概率密度函数,其中所述概率密度函数与e为底的指数函数成正比,且所述指数函数的指数包括所述声源信号的m/n次方,其中m=2,n=(2a+1)/(2a‑1),a为自然数;基于声源信号的概率密度函数,获取针对各帧频域子信号的分离矩阵;通过针对各帧频域子信号的分离矩阵,获取至少一个声源信号的各帧频域子信号的后验估计信号;基于至少一个声源信号的各帧频域子信号的后验估计信号,获取分离后的至少一个声源信号的时域信号。该方法能够实现较好的分离效果。
技术领域
本公开涉及语音信号处理领域,尤其涉及一种分离语音信号的方法、装置及介质。
背景技术
语音分离是将目标语音从噪声干扰中分离出来,其具有广泛的应用,如助听器设计、鲁棒性自动语音识别(ASR)、免提通信和自动会议记录。在实际的房间环境中进行语音分离时,由于混响的存在,语音分离就成为卷积盲源分离(CBSS)问题。对于超定的卷积混合模型,在频域内独立分量分析(ICA)后接置换校正装置和独立向量分析(IVA)是近十年来发展起来的标准技术。
独立向量分析(IVA)在理论上可以避免频域独立分量分析中出现的排列模糊现象,该方法是通过使用多变量源先验信息来保持每个源的不同频率箱之间的依赖关系。基于辅助函数的独立向量分析(AuxIVA)是一种稳定、快速的IVA更新算法,它不包含任何调整参数。
发明内容
为克服相关技术中存在的问题,本公开提供的分离语音信号的方法、装置及介质较好地保持了语音信号不同频率库之间的相关性,提高了分离性能。
根据本公开实施例的第一方面,提供一种分离语音信号的方法,包括:
对待分离的时域混合语音信号进行分帧处理,获取多帧时域子信号,所述时域混合语音信号包括至少两个声源信号;
获取所述时域子信号的频域子信号;
设置所述声源信号概率密度函数,其中所述概率密度函数与e为底的指数函数成正比,且所述指数函数的指数包括所述声源信号的m/n次方,其中m=2,n=(2a+1)/(2a-1),a为自然数;
基于所述声源信号的概率密度函数,获取针对各帧频域子信号的分离矩阵;
通过针对各帧频域子信号的分离矩阵,获取至少一个声源信号的各帧频域子信号的后验估计信号;
基于至少一个声源信号的各帧频域子信号的后验估计信号,获取分离后的所述至少一个声源信号的时域信号。
其中,所述设置所述声源信号概率密度函数,包括:a的取值设置为1,n的取值设置为3。
其中,所述获取针对各帧频域子信号的分离矩阵,包括通过下述方法获取针对每个当前帧频域子信号的分离矩阵:
通过针对上一帧频域子信号的分离矩阵与当前帧频域子信号相乘,获取当前帧声源信号频域子信号的先验估计信号;
基于所述当前帧声源信号频域子信号的先验估计信号和针对上一帧频域子信号的分离矩阵,获取针对当前帧频域子信号的分离矩阵。
其中,所述基于所述当前帧声源信号频域子信号的先验估计信号和针对上一帧频域子信号的分离矩阵,获取针对当前帧频域子信号的分离矩阵,包括:
获取针对上一帧频域子信号的加权协方差矩阵;
基于所述针对上一帧频域子信号的加权协方差矩阵和所述当前帧声源信号频域子信号的先验估计信号,获取针对当前帧频域子信号的加权协方差矩阵;
通过所述针对上一帧频域子信号的分离矩阵和针对当前帧频域子信号的加权协方差矩阵相乘,获取针对当前帧频域子信号的分离矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010080829.2/2.html,转载请声明来源钻瓜专利网。