[发明专利]基于输出抵消噪声的语音降噪的方法及系统以及智能终端在审
申请号: | 201610024759.2 | 申请日: | 2016-01-14 |
公开(公告)号: | CN106971707A | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 祝铭明 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G10K11/178 | 分类号: | G10K11/178;G10L15/20 |
代理公司: | 上海申新律师事务所31272 | 代理人: | 党蕾 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 输出 抵消 噪声 语音 方法 系统 以及 智能 终端 | ||
技术领域
本发明涉及语音识别技术领域,尤其涉及一种基于输出抵消噪声的语音降噪的方法及系统以及智能终端。
背景技术
现有技术中,在一些支持语音操作的智能终端中往往必须用到语音识别的功能,即通过识别说话人的声纹以及语句得到智能终端能够执行的指令,并进而根据该指令执行相应的操作。然而,在某些非说话人语音的噪声干扰较强的应用场合(例如应用在一个说话人较多的空间,或者所应用的空间的背景噪声较强),由于背景噪声与说话人的语音指令糅合在一起,会使语音识别更为困难,识别准确度大大降低。
现有技术中,当背景噪声相对较小时可以采用一些现有的方法(例如谱减法和Wiener滤波)在语音识别过程中进行噪声滤波,并取得了较为显著的效果。但是对于一些背景噪声较大的应用环境下,现有技术无法从背景噪声较大的环境中提取纯语音的技术方案。
发明内容
根据现有技术中存在的上述问题,现提供一种基于输出抵消噪声的语音降噪的方法及系统以及智能终端的技术方案,具体包括:
一种基于输出抵消噪声的语音降噪的方法,适用于智能终端,其中,提供复数个预先训练的不同声音强度的抵消噪声,包括下述步骤:
步骤S1,采集外部输入的语音;
步骤S2,获取所述语音的声音强度,将所述语音的声音强度与复数个不同声音强度的所述抵消噪声进行匹配,获取与所述语音的声音强度相同的所述抵消噪声,并输出所述抵消噪声;
步骤S3,采集外部输入的语音,并判断所述语音的声音强度是否高于一 预设的强度阈值,并在所述声音强度高于所述强度阈值时将所述语音确认为待判断语音,并转向步骤S4;
步骤S4,根据所述待判断语音的频谱,生成对应所述待判断语音上每个频带的估计标识,所述估计标识用于表示所述语音在谐波结构上的显著性;
步骤S5,生成对应于所述待判断语音的纯语音的概率模型;
步骤S6,以每个所述估计标识作为对应的所述待判断语音的所述频带的权重指标,依据所述概率模型处理得到关联于所述语音的纯语音估计值。
优选的,该基于输出抵消噪声的语音降噪的方法,其中,所述步骤S4中生成的所述估计标识包括第一估计标识;或者
所述步骤S4中生成的所述估计标识包括第一估计标识和第二估计标识。
优选的,该基于输出抵消噪声的语音降噪的方法,其中,所述步骤S4中,生成所述第一估计标识的步骤具体包括:
步骤S41a,依据所述待判断语音的所述频谱,提取对应于所述待判断语音的所述谐波结构;
步骤S42a,对关联于所述谐波结构的数谱域上的监控值进行规则化处理,并依据梅尔刻度对经过规则化处理的所述监控值执行平滑处理;
步骤S43a,对经过平滑处理的所述监控值进行进一步的规则化处理,以使所述监控值的均值为1;
步骤S44a,根据所述监控值生成对应所述待判断语音的每个所述频带的所述第一估计标识。
优选的,该基于输出抵消噪声的语音降噪的方法,其中,所述步骤S6中,根据所述第一估计标识处理得到所述纯语音估计值的方法具体包括:
步骤S61a,处理得到关联于所述待判断语音的最小均方误差估计的后验概率;
步骤S62a,以每个所述第一估计标识作为对应的所述待判断语音的所述频带的权重指标,依据所述概率模型对关联于所述待判断语音的所述后验概率进行加权计算,以得到所述纯语音估计值。
优选的,该基于输出抵消噪声的语音降噪的方法,其中,所述步骤S4中,生成所述第二估计标识的步骤具体包括:
步骤S41b,依据所述待判断语音的所述频谱,提取对应于所述待判断语 音的所述谐波结构;
步骤S42b,对关联于所述谐波结构的数谱域上的监控值进行规则化处理,并依据梅尔刻度对经过规则化处理的所述监控值执行平滑处理;
步骤S43b,对经过平滑处理的所述监控值从0到1进行相应的规则化处理;
步骤S44b,根据所述监控值生成对应所述待判断语音的每个所述频带的所述第二估计标识。
优选的,该基于输出抵消噪声的语音降噪的方法,其中,执行所述步骤S6之后,还根据所述第二估计标识继续执行下述步骤:
针对所述待判断语音的每个频带,将每个对应的所述第二估计标识作为权重,以在所述监控值与所述纯语音估计值之间执行线性插值并处理得到对应的输出值。
一种基于输出抵消噪声的语音降噪的系统,适用于智能终端,其中,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610024759.2/2.html,转载请声明来源钻瓜专利网。