[发明专利]一种联合语音增强的语音活动检测方法在审
申请号: | 202110292283.1 | 申请日: | 2021-03-18 |
公开(公告)号: | CN113113049A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 张晓雷;谭旭;陈益江 | 申请(专利权)人: | 西北工业大学;西北工业大学深圳研究院 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/84;G10L25/30;G06N3/04;G06N3/08 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种联合语音增强的语音活动检测方法,首先在Conv‑TasNet全卷积网络基础上构建联合网络模型,联合网络模型整体分为三个部分:编码器、时间卷积网络和解码器;针对语音增强SE任务和语音活动检测VAD任务采用两个单独的解码器,而共用同一组编码器与TCN网络;TCN网络输出掩码与编码器输出点乘后作为两个解码器的输入;采用mSI‑SDR及交叉熵的联合损失函数在训练阶段对结果进行评估;最终采用Adam优化器对网络进行训练,训练完成的网络能够较好地实现语音活动检测。本发明通过将语音增强和语音端点检测联合训练,提高了语音端点检测的鲁棒性,使其在复杂的噪声环境,特别是人声干扰剧烈的环境中依然能够保持较高的性能。 | ||
搜索关键词: | 一种 联合 语音 增强 活动 检测 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学;西北工业大学深圳研究院,未经西北工业大学;西北工业大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110292283.1/,转载请声明来源钻瓜专利网。