[发明专利]一种语音提取方法、装置及设备在审
申请号: | 202111032297.6 | 申请日: | 2021-09-03 |
公开(公告)号: | CN113744719A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 史慧宇;尹首一;韩慧明;刘雷波;魏少军 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L21/0272 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 谢层层;徐焕 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 提取 方法 装置 设备 | ||
本说明书实施例提供一种语音提取方法、装置及设备。所述方法包括:获取混合语音样本数据;所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和目标语音信号;利用所述混合语音样本数据训练预设语音分离模型,得到预训练语音分离模型;基于所述预训练语音分离模型构建策略网络和评估网络;所述策略网络和评估网络对应有网络参数;基于所述网络参数确定目标量化策略;利用目标量化策略更新所述预训练语音分离模型得到语音提取模型;利用所述语音提取模型从待处理语音数据中提取目标对象语音信号。上述方法减小了语音提取模型的规模,进而快速有效地对单通道语音中的目标对象的语音实现了分离。
技术领域
本说明书实施例涉及语音信号处理技术领域,特别涉及一种语音提取方法、装置及设备。
背景技术
随着计算机以及人工智能等技术的发展,基于智能设备的自动语音识别也获得了广泛的应用。而在实际应用中,智能设备在采集目标对象的语音的同时,往往也同时收纳了其他对象的语音、环境中的噪声等干扰信号。因此,在进行语音识别之前,首先要从所获取的语音信号中提取出对应于目标对象的语音信号。
目前在处理多通道语音信号时,可以通过比对不同通道的语音信号来进行语音提取。但在处理单通道语音信号时,直接从嘈杂和混响的环境中提取出相应的声源具有更大的难度。当前所存在一些对单通道语音信号进行分离的方法主要是在原有模型的基础上,通过扩展模型结构以及增加模型参数量的方式来提升模型性能,但这样一来,不仅对于计算设备的性能提出了更高的要求,同时也大大延长了计算时间。因此,目前亟需一种能够在保证语音分离效果的前提下,减小语音提取模型的规模以实现快速有效地对单通道语音进行提取的方法。
发明内容
本说明书实施例的目的是提供一种语音提取方法、装置及设备,以解决如何减小语音提取模型的规模以实现快速有效地对语音进行提取的问题。
为解决上述技术问题,本说明书实施例提供一种语音提取方法,包括:获取混合语音样本数据;所述混合语音样本数据为单通道语音信号;所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和目标语音信号;利用所述混合语音样本数据训练预设语音分离模型,得到预训练语音分离模型;基于所述预训练语音分离模型构建策略网络和评估网络;所述策略网络和评估网络对应有网络参数;基于所述网络参数确定目标量化策略;所述目标量化策略用于确定对于预训练语音分离模型的优化方式;利用目标量化策略更新所述预训练语音分离模型得到语音提取模型;利用所述语音提取模型从待处理语音数据中提取目标对象语音信号;所述待处理语音数据包括单通道语音信号。
本说明书实施例还提出一种语音提取装置,包括:混合语音样本数据获取模块,用于获取混合语音样本数据;所述混合语音样本数据为单通道语音信号;所述混合语音样本数据中包括噪声信号、干扰语音信号、混响信号中的至少一种和目标语音信号;预设语音分离模型训练模块,用于利用所述混合语音样本数据训练预设语音分离模型,得到预训练语音分离模型;网络构建模块,用于基于所述预训练语音分离模型构建策略网络和评估网络;所述策略网络和评估网络对应有网络参数;目标量化策略确定模块,用于基于所述网络参数确定目标量化策略;所述目标量化策略用于确定对于预训练语音分离模型的优化方式;预训练语音分离模型更新模块,用于通过所述目标量化策略更新所述预训练语音分离模型得到语音提取模型;目标对象语音信号提取模块,用于利用所述语音提取模型从待处理语音数据中提取目标对象语音信号;所述待处理语音数据包括单通道语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111032297.6/2.html,转载请声明来源钻瓜专利网。