[发明专利]用于增强信号中需要分量的装置和方法有效
申请号: | 201780082684.6 | 申请日: | 2017-01-23 |
公开(公告)号: | CN110168640B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 肖玮;金文宇 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L25/84 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;李稷芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 增强 信号 需要 分量 装置 方法 | ||
一种信号增强器,包括输入,用于接收具有需要分量和不需要分量的音频信号。所述信号增强器还包括感知分析器,用于将所述音频信号分离成多个频谱分量。所述感知分析器还用于:对于每个频谱分量,根据与所述频谱分量相关的功率估计,将所述频谱分量指定为属于所述需要分量或所述不需要分量。如果频谱分量被指定为属于所述不需要分量,则所述感知分析器将通过对所述频谱分量应用自适应增益来调整其功率;其中,所述自适应增益根据所述频谱分量对用户的期望可感知程度进行选择。这提高了所述需要分量的清晰度。
技术领域
本发明涉及一种用于增强信号的装置和方法,其中所述信号具有需要分量和不需要分量。
背景技术
增强噪声信号中的语音分量是有帮助的。例如,语音增强可以帮助改善通过电信网络等进行的语音通信的主观质量。另一个例子是自动语音识别(automatic speechrecognition,简称ASR)。如果要扩展ASR的使用,则需要提高其对噪声条件的可靠性。一些商用ASR解决方案声称其提供良好性能,例如,词错误率(word error rate,简称WER)低于10%。但是,这种性能通常只有在几乎没有噪音的良好情况下才能实现。在复杂的噪声条件下,WER会高于40%。
增强语音的一种方法是使用多个麦克风捕获音频信号,然后使用最佳滤波器对这些信号进行滤波。所述最佳滤波器通常是自适应滤波器,其受制于某些约束,例如最大限度增加信噪比(signal-to-noise ratio,简称SNR)。这种技术主要基于噪声控制,并且很少考虑听觉感知。其在高噪声水平下不够稳定。太强的处理也会削弱语音分量,导致ASR性能低下。
另一种方法主要基于对前景语音的控制,因为与噪声相比,语音成分往往具有独特的特征。这种方法使用所谓的“掩蔽效应”增加了语音和噪声之间的功率差异。根据心理声学,如果两个信号分量之间的功率差异足够大,则掩蔽者(具有较高功率)将掩蔽被掩蔽者(具有较低功率),使得被掩蔽者不可再听觉感知。得到的信号是具有更高清晰度的增强信号。
利用掩蔽效应的一种技术是计算听觉场景分析(Computational Auditory SceneAnalysis,简称CASA)。其工作原理是:检测信号中的语音分量和噪声分量并掩蔽噪声分量。CN105096961中描述了特定CASA方法的一个示例。图1示出了概览。在这种技术中,一组多个麦克风信号之一被选择作为主通道并进行处理以产生目标信号。然后,所述目标信号用于定义用于产生增强语音信号的最佳滤波器的约束。这种技术利用二进制掩码,所述二进制掩码通过将主信号频谱中低于参考功率的时间和频率点设置为0,将高于所述参考功率的频率点设置为1进行生成。这是一种简单的技术,尽管CN105096961提出了一些附加处理,但通过这种方法产生的目标信号通常具有许多频谱空洞。所述附加处理还在这种技术中引入了一些不希望的复杂性,包括需要两次时频变换及其逆变换。
发明内容
本发明的目的在于提供用于增强信号中需要分量的改进概念。
上述及其它目的通过独立权利要求的特征来实现。根据从属权利要求、说明书以及附图,进一步的实现形式是显而易见的。
根据第一方面,提供一种信号增强器,所述信号增强器包括输入,用于接收具有需要分量和不需要分量的音频信号。所述信号增强器还包括感知分析器,用于将所述音频信号分离成多个频谱分量。所述感知分析器还用于:对于每个频谱分量,根据与所述频谱分量相关的功率估计,将所述频谱分量指定为属于所述需要分量或所述不需要分量。如果频谱分量被指定为属于所述不需要分量,则所述感知分析器将通过对所述频谱分量应用自适应增益来调整其功率;其中,所述自适应增益根据所述频谱分量对用户的期望可感知程度进行选择。这提高了所述需要分量的清晰度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780082684.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据编码检测
- 下一篇:用于确定音高信息的装置和方法