[发明专利]一种言语增强助听方法有效
申请号: | 201810767532.6 | 申请日: | 2018-07-13 |
公开(公告)号: | CN109147808B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 梁瑞宇;包永强;王青云;谢跃;唐闺臣;冯月芹 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;H04R25/00;G06N3/04 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 211167 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 言语 增强 方法 | ||
1.一种言语增强助听方法,其特征在于:包括以下步骤,
步骤(A),多通道语音分解:将输入的语音信号进行多通道分解,分解成子带信号;
步骤(B),子带增益调整:根据听障患者的听力图,对各子带信号进行增益调整;
步骤(C),言语增强助听网络构建:构建包含患者的个性信息、听力图、不同噪声环境下的输入语音信号、期望补偿后的语音数据库,并按照编码层、解码层、输出层和注意层结构构建深度学习网络,并利用数据库对深度学习网络进行模型训练;所述解码层包含两层卷积长短期记忆网络,所述输出层为一层卷积长短期记忆网络,所述注意层为一层卷积长短期记忆网络,所述编码层包含两层卷积长短期记忆网络,其中,第二层卷积长短期记忆网络的输出与输出层的输出一起通过注意层生成一组权重,将该组权重作用于不同的子带信号通道;
步骤(D),语音补偿输出:将步骤(B)中进行增益调整后的子带信号输入步骤(C)模型训练后的深度学习网络中,生出补偿后的语音信号,并进行输出。
2.根据权利要求1所述的一种言语增强助听方法,其特征在于:步骤(A),多通道语音分解,包括以下步骤,
(A1),根据人耳的伽马通刻度来设定32个子带滤波器的中心频率;
(A2),根据听损患者的听力图,将随频率的变化趋势对响度值相等或波动小且低于波动阈值的连续频带进行合并;
(A3),将均匀余弦调制滤波器组的相邻通道,根据(A2)的合并规则进行合并,生成所需非均匀滤波器组;
(A4)将输入的语音信号通过(A3)所述的非均匀滤波器组,生成分解后的子带信号。
3.根据权利要求2所述的一种言语增强助听方法,其特征在于:所述波动阈值为5dB。
4.根据权利要求1所述的一种言语增强助听方法,其特征在于:步骤(B),根据听障患者的听力图,对各子带信号进行增益调整,具体为将初始的增益补偿量设为听障患者听力损失的一半。
5.根据权利要求1所述的一种言语增强助听方法,其特征在于:卷积长短期记忆网络,由智能调节器、输出控制、细胞更新处理、激活函数、乘法器组成,当前时刻t的输出都受到前一时刻t-1的细胞状态和隐层状态的影响,所述卷积长短期记忆学习单元,表达式如式(1)所示,
其中,Gt是智能调节器输出针对候选细胞状态与前一时刻细胞状态的加权值,通过softmax将一组向量映射成另一组取值在0-1之间的常数,并获得相应的概率值,其中sigmoid函数表示将一组向量映射成一个取值在0-1之间的常数;为当前时刻状态信息的候选值;Ct和Ct-1为t时刻和t-1时刻的细胞状态;ot是当前输出控制量;ht和ht-1为t时刻和t-1时刻的隐层状态输出;与ot的计算中均采用卷积操作,用来挖掘多通道数据内在关系;Wa、与Wo分别为智能调节器、状态信息和输出控制门的权值,与bo分别代表状态信息和输出控制门的偏置;xt和xt-1分别为t时刻和t-1时刻的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810767532.6/1.html,转载请声明来源钻瓜专利网。