[发明专利]一种噪声环境下的基于深度神经网络的语音唤醒方法在审
申请号: | 202111381090.X | 申请日: | 2021-11-20 |
公开(公告)号: | CN114067789A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 赵亚丽;明杨;缪炜 | 申请(专利权)人: | 上海互问信息科技有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/16;G10L21/0208;G10L25/24;G10L25/30 |
代理公司: | 北京盛凡佳华专利代理事务所(普通合伙) 11947 | 代理人: | 王艳 |
地址: | 200000 上海市浦东新区中国(上海)自由贸易*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 噪声 环境 基于 深度 神经网络 语音 唤醒 方法 | ||
本发明涉及一种噪声环境下的基于深度神经网络的语音唤醒方法,包括包含训练抗噪唤醒模型和唤醒识别,所述训练唤醒模型部分使用干净语音和对应的带噪语音作为训练样本,对所构建的语音唤醒模型进行迭代训练,获得带有抗噪功能的唤醒模型;所述唤醒识别将待识别数据进行与训练时相同的特征提取后,输入到语音唤醒模型,然后分析模型输出分数以得到最终的唤醒结果。该噪声环境下的基于深度神经网络的语音唤醒方法,传统基于单通道的语音增强算法不能处理音乐、TV等非稳态的噪声,使得算法在非稳态噪声下的唤醒效果下降严重,本语音唤醒方法只需要在训练时对非稳态噪声进行学习,模型的第一部分就能对非稳态噪声进行降噪。
技术领域
本发明涉及语音唤醒技术领域,具体为一种噪声环境下的基于深度神经网络的语音唤醒方法。
背景技术
语音唤醒技术是智能语音设备的关键技术,指的是用户通过说出指定的唤醒词,使得智能设备从休眠状态进入激活状态,以接受进一步的命令。
但在存在噪声尤其是较强噪声的环境下,语音设备的体验感下降严重,唤醒词既容易被诸如音乐声、电视声和背景语音错误地激活,同时噪声环境下正确唤醒的成功率也会受到很大影响,为了改善这种情况,送入唤醒的音频通常会预先通过语音增强的前端模块进行处理,以得到去除噪声后的音频,但是,这种语音经过语音增强前端后得到音频,再进行唤醒检测的方法有着这样的缺陷:
1.语音增强算法一般都是时域变换到频域后再进行降噪处理,然后再反变换回时域,这中间损失了部分中间信息,导致增强后的语音有畸变;
2.传统的单通道的语音增强前端对于音乐声、电视声等背景噪声的抑制效果有限;
3.语音增强前端的目标是对噪声进行压制,而不是提高唤醒率,因此对唤醒的帮助有限;
4.语音增强是单独的模块,唤醒算法模型需要适配语音增强模块以学习其降噪带来的畸变,使得唤醒系统灵活性差。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种噪声环境下的基于深度神经网络的语音唤醒方法,具备使语音唤醒模型不仅能充分利用语音增强的结果,而且两者还能都以提高唤醒率为目标进行优化,可以实现噪声情况下尤其是非稳态噪声环境下更好的效果,同时,融合语音增强功能的唤醒模型在结构上可以看作一个唤醒模型,不需要外接一个新的语音增强前端,避免了前后端不匹配的问题优点,解决了现有语音增强算法一般都是时域变换到频域后再进行降噪处理,然后再反变换回时域,这中间损失了部分中间信息,导致增强后的语音有畸变;传统的单通道的语音增强前端对于音乐声、电视声等背景噪声的抑制效果有限;语音增强前端的目标是对噪声进行压制,而不是提高唤醒率,因此对唤醒的帮助有限;语音增强是单独的模块,唤醒算法模型需要适配语音增强模块以学习其降噪带来的畸变,使得唤醒系统灵活性差的问题。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:一种噪声环境下的基于深度神经网络的语音唤醒方法,包括包含训练抗噪唤醒模型和唤醒识别,所述训练唤醒模型部分使用干净语音和对应的带噪语音作为训练样本,对所构建的语音唤醒模型进行迭代训练,获得带有抗噪功能的唤醒模型;
所述唤醒识别将待识别数据进行与训练时相同的特征提取后,输入到语音唤醒模型,然后分析模型输出分数以得到最终的唤醒结果。
进一步,所述训练唤醒模型部分包括准备训练数据、特征提取和模型训练,所述唤醒识别包括特征提取、输入模型和解码。
进一步,所述准备训练数据将用于训练的干净唤醒词数据和不同类型的噪声,以不同信噪比进行加噪,得到带噪的语音数据。
进一步,所述特征提取将干净语音和带噪语音进行加窗,分帧,傅里叶变换,并基于梅尔域进行特征提取,得到在不同频域上的能量谱密度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海互问信息科技有限公司,未经上海互问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111381090.X/2.html,转载请声明来源钻瓜专利网。