[发明专利]数字助听器中深度和广度神经网络相结合的语音增强算法有效
申请号: | 201510999943.4 | 申请日: | 2015-12-27 |
公开(公告)号: | CN105611477B | 公开(公告)日: | 2018-06-01 |
发明(设计)人: | 李如玮;时勇强 | 申请(专利权)人: | 北京工业大学 |
主分类号: | H04R25/00 | 分类号: | H04R25/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 噪声 语音增强算法 数字助听器 语音信号 语音活动性检测 语音信号处理 自相关函数 测试算法 输出语音 向量量化 训练过程 自动选取 助听器 复杂度 可懂度 判决器 实时性 语音段 再利用 并联 方差 级联 去除 算法 网络 语音 检测 学习 | ||
数字助听器中深度和广度神经网络相结合的语音增强算法,属于语音信号处理技术领域。该方法首先对含噪语音信号进行语音活动性检测,提取含噪语音信号的自相关函数最大值和频带方差等特征,再利用BP神经网络建立一个二值判决器,判断出语音段和噪声段。其次,提取MFCC和一阶MFCC特征,采用学习向量量化神经网络与BP神经网络级联构成的深度神经网络,检测出噪声的类型。最后,建立多种网络并联构成的广度神经网络,根据噪声的类型,广度神经网络自动选取相应的神经网络,去除噪声,得到增强后的语音,提高助听器输出语音的可懂度。该算法中神经网络的训练过程都是在线下完成,而训练好的网络的测试算法复杂度低,因此,满足实时性。
技术领域
本发明属于语音信号处理技术领域,涉及到数字助听器中噪声分类和语音增强两个关键的语音信号处理技术。
背景技术
通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。然而,对于耳聋耳障患者来说,不能进行正常的语音信息交流将严重影响他们的日常生活。随着全球社会人口老龄化的日趋明显,耳聋耳障患者的人数也在与日俱增,听障问题也越来越突出。然而,对于大多数患者来说,佩戴合适的数字助听器可有效地改善听力现状,大大提高听力水平。目前,市场上助听器种类繁多,按外部结构可分为:盒式、耳背式、普通耳内式、耳道式、深耳道式;按电子原理可分为:模拟助听器、数字助听器;按传导方式可分为:气导助听器、骨导助听器。
数字助听器是目前市场上最先进的助听器,可根据患者的听力情况利用数字处理技术灵活地补偿他们需要的声音,过滤掉不需要的声音,同时还可根据听力需求的改变而改变。它具有以下优点:1.自动适应环境,有效降低噪声,提高语言的清晰度;2.再现自然声音,优化患者对自己声音的感受,提高声音的自然性、真实性和舒适性;3.自动消除反馈声,应用数字反馈抑制技术,使助听器不会出现令人烦恼的反馈声(啸叫),这对提高患者的语言分辨能力有重要的作用。数字助听器的工作原理如下:首先,外界的声学信号进入麦克风,麦克风将声能转化为电能,输出对应的电信号。紧接着,电信号通过放大器进行预防大,然后通过模/数转换器,将模拟信号转换为数字信号。在DSP上,利用数字处理技术,对含噪语音信号进行处理,得到处理后的数字信号。然后再通过数/模转换器,将处理后的数字信号转换为模拟信号,并通过放大器,进行最终放大。最后,由受话器输出处理后的语音。
在数字助听器的整个工作过程中,DSP上的算法是核心部分。对于佩戴助听器的耳聋耳障患者来说,在噪声环境下,助听器的性能将大大下降,与周围的人进行交流将受到严重影响。所以,必须采用语音增强算法消除背景噪声,从而提高数字助听器的言语可懂度。另外,当噪声环境发生改变时,要自动识别并切换到对应的噪声环境模式下进行消噪,这就需要加入噪声分类算法,并针对不同的噪声采取不同的消噪算法,从而提高数字助听器的适用性。除此之外,针对数字助听器可能产生的“啸叫”现象,还需要加入反馈消除算法,从而提高数字助听器的稳定性。由此可知,噪声分类和语音增强是数字助听器中十分重要和关键的技术,它们直接决定着数字助听器性能的优劣。
在复杂的噪声环境中,一些语音增强算法对言语的可懂度提高十分有限,并且还会破坏言语的舒适度(比如,引入“音乐噪声”)。因此,如何有效地消除噪声是设计数字助听器的关键所在。目前,谱减法被大多数数字助听器所采用,虽然该语音增强算法简单,但在去除噪声的同时引进了“音乐噪声”,在经过后面的放大模块后,“音乐噪声”也会被同时放大,严重影响了数字助听器的言语可懂度和舒适度。此外,在现实生活中,噪声环境会随时发生变化,由室内到户外,由办公室到工厂,等等。显然,没有一种语音增强算法可以适应所有的噪声环境,这就需要对噪声进行分类,针对不同的噪声采用不同的语音增强算法或模型,从而提高算法的适应性,但算法复杂度会大大增加。
数字助听器作为一种便携式医疗器械,它需要很高的实时性,这就需要算法具有低复杂度、低功耗等等。为了让佩戴助听器的耳聋耳障患者享受到较高的言语可懂度和舒适度,噪声分类和语音增强两项技术是数字助听器技术的关键。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510999943.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种银杏叶提取物与双密达莫的复方注射液及其制备工艺
- 下一篇:新型烧水壶