[发明专利]语音增强模型的训练方法和装置及语音增强方法和装置在审
申请号: | 202110529546.6 | 申请日: | 2021-05-14 |
公开(公告)号: | CN113284507A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 张新;郑羲光;张晨 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L21/0216 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 苏银虹;曾世骁 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开关于一种语音增强模型的训练方法和装置及语音增强方法和装置,语音增强模型包括噪声掩膜比预测网络和噪声类型判别网络,训练方法包括:获取含噪语音样本,含噪语音样本由说话人语音样本与至少一种场景噪声数据混合而成;将至少一种场景噪声数据中的参考场景噪声数据输入噪声类型判别网络,得到参考场景噪声数据的噪声类型特征,参考场景噪声数据为期望去除的场景噪声数据;将含噪语音样本的幅度谱和噪声类型特征输入噪声掩膜比预测网络,得到参考场景噪声数据的估计的噪声掩膜比;基于估计的噪声掩膜比和噪声类型特征,计算损失函数;通过计算出的损失函数调整噪声掩膜比预测网络和噪声类型判别网络的参数,对语音增强模型进行训练。 | ||
搜索关键词: | 语音 增强 模型 训练 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110529546.6/,转载请声明来源钻瓜专利网。