[发明专利]一种数字助听器中基于深度学习的双耳声源定位方法有效
申请号: | 201711397816.2 | 申请日: | 2017-12-21 |
公开(公告)号: | CN108122559B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 李如玮;潘冬梅;李涛;刘亚楠;张永亚 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G10L19/26 | 分类号: | G10L19/26;G10L21/0264;G10L25/06;G10L25/30;H04R25/00;G01S5/20 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种数字助听器中基于深度学习的双耳声源定位方法,首先将双耳声源信号通过gammatone滤波器分解成若干信道,通过加权系数提取高能量的信道,接着利用头相关函数(head‑related‑transform function,HRTF)提取第一类特征,即耳间时间差(Interaural Time Difference,ITD)和耳间强度差(Interaural Intensity Difference,IID)作为深度学习的输入,将水平面划分为四个象限,缩小定位范围。然后提取头相关传递的第二类特征,即耳间声压差(Interaural Level Difference,ILD)和耳间相位差(Interaural Phase Difference,IPD),最后为了得到更精确的定位,将第一类和第二类的四个特征作为下一个深度学习的输入,从而得到声源定位的方位角。实现在水平面上0度到360度以5度为步长进行72个方位角的精确定位。 | ||
搜索关键词: | 一种 数字 助听器 基于 深度 学习 声源 定位 方法 | ||
【主权项】:
一种数字助听器中基于深度学习的双耳声源定位方法,其特征在于,包括以下步骤:步骤一,利用人耳听觉感知理论,结合人耳的听觉特性和耳蜗的工作机理,把双耳语音信号通入gammatone滤波器分成N个通道,并提取人耳敏感信息;步骤二,利用头相关传递函数的双耳定位线索提取第一类特征,即耳间时间差和耳间强度差;步骤三,将第一类特征作为深度学习的输入,利用深度学习的分类功能把水平面平均分成四个象限;步骤四,再次利用头相关传递函数的双耳定位线索提取第二类特征,即耳间声压差和耳间相位差;步骤五,将第一类和第二类的特征相结合,同时利用深度学习在步骤三得到的具体象限里进行水平面方位角的定位。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711397816.2/,转载请声明来源钻瓜专利网。