[发明专利]语音分离方法、装置、介质和电子设备在审
申请号: | 201910595347.8 | 申请日: | 2019-07-03 |
公开(公告)号: | CN112185411A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 顾昭仪;卢晶 | 申请(专利权)人: | 南京人工智能高等研究院有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 210046 江苏省南京市栖霞区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 分离 方法 装置 介质 电子设备 | ||
公开了一种语音分离方法、装置、介质和电子设备。其中的语音分离方法包括:获取待处理的时频域混合信号;根据所述时频域混合信号以及包含有幅度调整因子的高斯混合模型的独立向量分析的代价函数,获得所述时频域混合信号的分离矩阵;根据所述分离矩阵,从所述时频域混合信号中获得每个声源的时频域信号。本公开提供的技术方案有利于提高语音分离技术的可实施性,从而有利于提高语音分离技术的适用范围。
技术领域
本公开涉及语音处理技术,尤其是一种语音分离方法、语音分离装置、存储介质以及电子设备。
背景技术
语音分离技术可以从由多个声源混合信号中提取出初始声源信号,从而实现对期望信号的增强。目前,语音分离技术已被使用于智能家居系统、视频会议系统以及语音识别系统等多种应用中。
基于GMM(Gaussian Mixture Model,高斯混合模型)-IVA(Independent VectorAnalysis,独立向量分析)的语音分离技术,是一种将GMM作为IVA算法中的声源先验模型的语音分离技术。然而,由于GMM中的参数通常需要采用预训练的方式来确定初始值,因此,基于GMM-IVA的语音分离技术不能较好的适用于无法进行预训练的应用场景中。如何提高基于GMM-IVA的语音分离技术的语音分离的适用范围,是一个值得关注的技术问题。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种语音分离方法、语音分离装置、存储介质以及电子设备。
根据本公开实施例的一方面,提供一种语音分离方法,包括:获取待处理的时频域混合信号;根据所述时频域混合信号以及包含有幅度调整因子的高斯混合模型的独立向量分析的代价函数,获得所述时频域混合信号的分离矩阵;根据所述分离矩阵,从所述时频域混合信号中获得每个声源的时频域信号。
根据本公开实施例的另一方面,提供一种语音分离装置,包括:获取混合信号模块,用于获取待处理的时频域混合信号;获取分离矩阵模块,用于根据所述获取混合信号模块获取到的时频域混合信号以及包含有幅度调整因子的高斯混合模型的独立向量分析的代价函数,获得所述时频域混合信号的分离矩阵;分离处理模块,用于根据所述获取分离矩阵模块获得的分离矩阵,从所述时频域混合信号中获得每个声源的时频域信号。
基于本公开上述实施例提供的一种语音分离方法以及装置,通过在高斯混合模型中设置幅度调整因子来适应音频信号的非平稳特点,从而可以在不需要对高斯混合模型中的多个参数进行预训练的情况下,利用待处理的时频域混合信号以及独立向量分析的代价函数,快捷的获得分离矩阵,从而可以利用分离矩阵,快捷的从时频域混合信号中获得每个声源的时频域信号。由此可知,本公开提供的技术方案有利于提高语音分离技术的可实施性,从而有利于提高语音分离技术的适用范围。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同描述一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1为本公开所适用的一个场景示意图;
图2为本公开所适用的另一个场景示意图;
图3为本公开的语音分离方法一个实施例的流程图;
图4为本公开的获取待处理的时频域混合信号的过程一个实施例的流程图;
图5为本公开的语音分离装置一个实施例的结构示意图
图6为本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京人工智能高等研究院有限公司,未经南京人工智能高等研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910595347.8/2.html,转载请声明来源钻瓜专利网。