[发明专利]基于集成学习与噪声感知训练的语音增强方法有效
申请号: | 201811385650.7 | 申请日: | 2018-11-20 |
公开(公告)号: | CN109256144B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 王兮楼;郭武 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216;G10L21/0232;G10L25/30 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于集成学习与噪声感知训练的语音增强方法,相比于静态噪声感知训练,能较为准确地跟踪非平稳噪声,同时,利用梯度提升决策树可以自发提取特征的特性,获得对每一个时频单元的噪声场景编码,为深度神经网络提供噪声的额外信息,而传统的噪声感知训练方法只能够获得噪声的幅度信息。从实验结果来看,本方法也优于采用静态噪声感知训练的语音增强方法。 | ||
搜索关键词: | 基于 集成 学习 噪声 感知 训练 语音 增强 方法 | ||
【主权项】:
1.一种基于集成学习与噪声感知训练的语音增强方法,其特征在于,包括:训练阶段:利用输入的带噪语音信号,训练用于动态噪声感知的梯度提升决策树模型;利用训练好的梯度提升决策树模型来估计带噪语音信号每个频带估计的噪声幅值以及噪声特征;将估计的噪声幅值以及噪声特征与带噪语音信号的对数频谱特征拼接起来,训练深层神经网络;测试阶段:将待增强的带噪语音信号输入之前训练的梯度提升决策树模型,得到估计的噪声幅值及噪声特征,并与待增强的语音信号的对数频谱特征拼接起来,再输入至训练好的深层神经网络,由深层神经网络的输出层预测干净语音的对数频谱特征,再结合待增强的带噪语音信号的相位,使用重叠相加法对进行波形重构,得到增强后的语音信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811385650.7/,转载请声明来源钻瓜专利网。