[发明专利]一种基于临界频带的双耳语音分离方法在审

申请号：	201710479139.2	申请日：	2017-06-22
公开（公告）号：	CN107346664A	公开（公告）日：	2017-11-14
发明（设计）人：	谈雅文;汤一彬;陈秉岩;高远	申请（专利权）人：	河海大学常州校区
主分类号：	G10L21/0308	分类号：	G10L21/0308
代理公司：	常州市科谊专利代理事务所32225	代理人：	孙彬
地址：	213022 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于临界频带和双耳声信号的语音分离方法，通过数据训练和声源的方位信息，在每个临界频带内对双耳声信号进行声源的分类，从而获得每个声源的数据流，重构得到分离后的每个声源信号，实现语音分离。本发明基于人耳听觉系统的分频处理机制，结合人耳的听觉掩蔽效应，根据不同声源的方位信息，在每一个临界频带内对混合语音进行分离，不同噪声和混响条件下的定位分离结果表明，基于临界频带的双耳语音分离，性能获得有效提升。
搜索关键词：	一种基于临界频带耳语音分方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于临界频带的双耳语音分离方法，其特征在于，该方法包括以下步骤：1)参数训练阶段：1.1)使用具有方向性的双耳白噪声信号进行训练，所述双耳白噪声信号为与头相关脉冲响应函数HRIR数据与单声道白噪声信号卷积生成的方位已知的双耳信号，双耳白噪声信号的声源方位角θ定义为方向矢量在水平面的投影与中垂面的夹角，其范围为[‑90°,90°]；1.2)对已知方位信息的双耳白噪声信号进行预处理，所述预处理过程包括幅度归一化处理、分帧加窗，得到分帧后的单帧双耳声信号；1.3)对步骤1.2)中得到的单帧双耳语音信号进行互相关函数运算，利用互相关函数计算单帧信号的耳间时间差ITD估计值，同一方位所有帧ITD估计值的均值作为该方位的ITD训练值，建立方位角θ的ITD模型，记为δ(θ)；1.4)对步骤1.2)中得到的单帧双耳语音信号进行短时傅里叶变换，将其变换到频域，计算左耳声信号和右耳声信号在每个频点幅度谱的比值，即耳间强度差IID矢量，同一方位所有帧IID估计值的均值作为该方位的IID训练值，建立方位角θ的IID模型，记为α(θ,ω)，ω表示傅里叶变换的频谱；2)基于临界频带和方位信息的双耳混合语音信号分离阶段：2.1)测试过程中的双耳混合语音信号，包含多个声源，且每个声源对应不同的方位，双耳混合语音信号进行预处理，所述预处理的方法与步骤1.2)中的预处理方法相同，包括幅度归一化处理、分帧加窗，；2.2)对分帧之后的双耳混合声信号进行傅里叶变换，基于临界频带的频率范围，对频域进行子带划分，得到分帧后的子带信号；2.3)根据混合声源信号包含的声源个数和方位信息，以及步骤1.3)和步骤1.4)建立的方位声信号ITD、IID参数，在步骤2.2)得到的每帧、每个临界频带内，基于左、右耳声信号的相似度，进行声源的分类；2.4)对步骤2.3)所得的临界频带分类结果与步骤2.1)中获得的分帧后的时频信号相乘，获得每个声源所对应的时频域信号；2.5)对步骤2.4)所得的每个声源对应的时频域信号进行傅里叶逆变换，转换为时域信号，进行去加窗，合成为每个声源的分离语音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于河海大学常州校区，未经河海大学常州校区许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710479139.2/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于临界频带的双耳语音分离方法在审

专利文献下载