[发明专利]音频信号的掩蔽阈值估计方法、装置及存储介质有效
申请号: | 201810949209.0 | 申请日: | 2018-08-20 |
公开(公告)号: | CN108899047B | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 李超;朱唯鑫 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/78;G10L25/84;G10L21/0208;G10L21/0272 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王珺;陈建焕 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提出一种音频信号的掩蔽阈值估计方法、装置及计算机可读存储介质。其中音频信号的掩蔽阈值估计方法包括:将待处理音频信号输入多任务的神经网络模型,所述神经网络模型是利用样本音频信号的声学特征、音素类别的标签和掩蔽阈值的标签训练得到的;从所述神经网络模型输出所述待处理音频信号的音素类别和所述待处理音频信号的掩蔽阈值;利用所述音素类别和所述掩蔽阈值对所述神经网络模型进行优化。本发明实施例的神经网络模型除了输出掩蔽阈值之外,又采用了音素类别作为神经网络模型的另一个输出,从而使用了更多的信息,有利于让网络学习的更好,从而获得更好的性能。 | ||
搜索关键词: | 掩蔽 神经网络模型 处理音频信号 音频信号 音素类别 阈值估计 输出 计算机可读存储介质 样本音频信号 标签训练 存储介质 声学特征 网络学习 音素 标签 优化 | ||
【主权项】:
1.一种音频信号的掩蔽阈值估计方法,其特征在于,包括:将待处理音频信号输入多任务的神经网络模型,所述神经网络模型是利用样本音频信号的声学特征、音素类别的标签和掩蔽阈值的标签训练得到的;从所述神经网络模型输出所述待处理音频信号的音素类别和所述待处理音频信号的掩蔽阈值;利用所述音素类别和所述掩蔽阈值对所述神经网络模型进行优化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810949209.0/,转载请声明来源钻瓜专利网。