[发明专利]数字助听器中深度和广度神经网络相结合的语音增强算法有效
申请号: | 201510999943.4 | 申请日: | 2015-12-27 |
公开(公告)号: | CN105611477B | 公开(公告)日: | 2018-06-01 |
发明(设计)人: | 李如玮;时勇强 | 申请(专利权)人: | 北京工业大学 |
主分类号: | H04R25/00 | 分类号: | H04R25/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 数字助听器中深度和广度神经网络相结合的语音增强算法,属于语音信号处理技术领域。该方法首先对含噪语音信号进行语音活动性检测,提取含噪语音信号的自相关函数最大值和频带方差等特征,再利用BP神经网络建立一个二值判决器,判断出语音段和噪声段。其次,提取MFCC和一阶MFCC特征,采用学习向量量化神经网络与BP神经网络级联构成的深度神经网络,检测出噪声的类型。最后,建立多种网络并联构成的广度神经网络,根据噪声的类型,广度神经网络自动选取相应的神经网络,去除噪声,得到增强后的语音,提高助听器输出语音的可懂度。该算法中神经网络的训练过程都是在线下完成,而训练好的网络的测试算法复杂度低,因此,满足实时性。 | ||
搜索关键词: | 神经网络 噪声 语音增强算法 数字助听器 语音信号 语音活动性检测 语音信号处理 自相关函数 测试算法 输出语音 向量量化 训练过程 自动选取 助听器 复杂度 可懂度 判决器 实时性 语音段 再利用 并联 方差 级联 去除 算法 网络 语音 检测 学习 | ||
【主权项】:
1.数字助听器中深度和广度神经网络相结合的语音增强算法,其特征在于,具体步骤如下:步骤一,对数字助听器的输入信号进行预处理,即去均值、归一化、预加重、分帧和加窗;步骤二,提取含噪语音信号的自相关函数最大值和频带方差两个特征,通过提取这两个特征来判断语音段和噪声段;步骤三,利用BP神经网络构建一个二值判决器,将步骤二中提取的两个特征作为一个二维矢量,输入到BP神经网络中;BP神经网络的输出是一个一维矢量,求出这个一维矢量的众数,将其设定为判决阈值;大于等于此阈值,为语音段;小于此阈值,为噪声段;步骤四,针对步骤三中判断出的噪声段提取MFCC和一阶MFCC;步骤五,利用一个LVQ神经网络后面级联三个BP神经网络,三个BP神经网络之间采用并联形式,构建成一个深度神经网络;步骤六,根据步骤四提取的MFCC和一阶MFCC,MFCC有16个参数,一阶MFCC有8个参数,将它们组成一个24维的矢量,输入到步骤五中构建的深度神经网络中;深度神经网络的输出则表示当前噪声信号的种类;步骤七,利用RBF神经网络、SOM神经网络、Hopfield神经网络、Elman神经网络、LVQ神经网络、Kohonen神经网络、GRNN神经网络、灰色神经网络、小波神经网络和NARX神经网络构建一个广度神经网络,各个神经网络之间采用并联形式;步骤八,根据步骤六中判别出的噪声信号的种类,步骤七中构建好的广度神经网络自动选择某一相对应的神经网络,对步骤三中得到的语音段进行语音增强;而对于步骤三中的噪声段,直接将数据置零;这样,就完成了最终的语音增强,再经过放大和受话器两个模块,得到数字助听器的输出信号;选择某一相对应的神经网络具体为:从15种噪声中选取一种噪声加入到纯净语音中,得到含噪语音;然后将这段含噪语音分别用RBF神经网络、SOM神经网络、Hopfield神经网络、Elman神经网络、LVQ神经网络、Kohonen神经网络、GRNN神经网络、灰色神经网络、小波神经网络和NARX神经网络进行语音增强;对比增强后的不同效果,将增强效果最好的神经网络与该噪声建立联系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510999943.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种银杏叶提取物与双密达莫的复方注射液及其制备工艺
- 下一篇:新型烧水壶