[发明专利]一种数字助听器中基于深度学习的双耳声源定位方法有效

申请号：	201711397816.2	申请日：	2017-12-21
公开（公告）号：	CN108122559B	公开（公告）日：	2021-05-14
发明（设计）人：	李如玮;潘冬梅;李涛;刘亚楠;张永亚	申请（专利权）人：	北京工业大学
主分类号：	G10L19/26	分类号：	G10L19/26;G10L21/0264;G10L25/06;G10L25/30;H04R25/00;G01S5/20
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	张慧
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种数字助听器中基于深度学习的双耳声源定位方法，首先将双耳声源信号通过gammatone滤波器分解成若干信道，通过加权系数提取高能量的信道，接着利用头相关函数(head‑related‑transform function,HRTF)提取第一类特征，即耳间时间差(Interaural Time Difference,ITD)和耳间强度差(Interaural Intensity Difference,IID)作为深度学习的输入，将水平面划分为四个象限，缩小定位范围。然后提取头相关传递的第二类特征，即耳间声压差(Interaural Level Difference,ILD)和耳间相位差(Interaural Phase Difference,IPD)，最后为了得到更精确的定位，将第一类和第二类的四个特征作为下一个深度学习的输入，从而得到声源定位的方位角。实现在水平面上0度到360度以5度为步长进行72个方位角的精确定位。
搜索关键词：	一种数字助听器基于深度学习声源定位方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种数字助听器中基于深度学习的双耳声源定位方法，其特征在于，包括以下步骤：步骤一，利用人耳听觉感知理论，结合人耳的听觉特性和耳蜗的工作机理，把双耳语音信号通入gammatone滤波器分成N个通道，并提取人耳敏感信息；步骤二，利用头相关传递函数的双耳定位线索提取第一类特征，即耳间时间差和耳间强度差；步骤三，将第一类特征作为深度学习的输入，利用深度学习的分类功能把水平面平均分成四个象限；步骤四，再次利用头相关传递函数的双耳定位线索提取第二类特征，即耳间声压差和耳间相位差；步骤五，将第一类和第二类的特征相结合，同时利用深度学习在步骤三得到的具体象限里进行水平面方位角的定位。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711397816.2/，转载请声明来源钻瓜专利网。

上一篇：一种LATM AAC音频流的实时转容实现方法及装置
下一篇：一种提取发动机噪声音调度的系统及方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种数字助听器中基于深度学习的双耳声源定位方法有效

专利文献下载