[发明专利]基于多头自注意力机制的语音增强方法有效
申请号: | 201911012632.9 | 申请日: | 2019-10-23 |
公开(公告)号: | CN110739003B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 常新旭;袁晓光;张杨;寇金桥;杨林;吴敏;王昕;徐冬冬;赵晓燕;闫帅 | 申请(专利权)人: | 北京计算机技术及应用研究所 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/27;G10L25/03 |
代理公司: | 中国兵器工业集团公司专利中心 11011 | 代理人: | 王雪芬 |
地址: | 100854*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于多头自注意力机制的语音增强方法,涉及语音增强技术领域。本发明本发明针对现有基于注意力机制的语音增强方法无法在注意力计算过程中明显抑制噪声的问题,基于对人类在听觉感知的过程中存在掩蔽效应的研究及利用,提出了一种基于多头自注意力机制的语音增强方法,该方法实现了在注意力机制运算的过程中抑制噪声部分,提高了语音增强性能。 | ||
搜索关键词: | 基于 多头 注意力 机制 语音 增强 方法 | ||
【主权项】:
1.一种基于多头自注意力机制的语音增强方法,其特征在于,包括以下步骤:/n步骤一:混合实验数据,提取对数功率谱特征;/n步骤二:构建基于多头自注意力机制的语音增强模型;/n步骤三:将步骤一提取的数据对所述语音增强模型进行训练;/n步骤四:将步骤一提取的数据作为待增强语音特征送入训练好的语音增强模型,输出得到相应的干净语音特征估计;/n步骤五:将步骤四所得到的待增强语音特征的干净语音特征估计进行波形重构,恢复语音信号。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京计算机技术及应用研究所,未经北京计算机技术及应用研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911012632.9/,转载请声明来源钻瓜专利网。