[发明专利]基于十字形声阵列宽带波束形成的声识别方法有效

申请号：	201610409905.3	申请日：	2016-06-12
公开（公告）号：	CN106023996B	公开（公告）日：	2019-08-27
发明（设计）人：	王天磊;王建中;曹九稳;赖晓平	申请（专利权）人：	杭州电子科技大学
主分类号：	G10L17/20	分类号：	G10L17/20;G01H17/00
代理公司：	杭州君度专利代理事务所(特殊普通合伙) 33240	代理人：	杜军
地址：	310027 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于十字形声阵列宽带波束形成的声识别方法。本发明包括如下步骤：1、将十字形声阵列对准所需方向采集声音信号；2、对采集到声音信号进行预处理；3、对预处理后的每一帧数据进行离散傅里叶变换，然后根据需要的频带进行频带提取；4、提取的各频带分别在所需方向上进行LSMI‑MVDR波束形成。5、将波束形成后的频域信号进行逆离散傅里叶变换；6、对应分帧时的原则进行帧重叠合成，输出信号；7、对输出信号进行特征提取和分类学习、识别。本发明能够提高期望方向接收信号的信噪比并且抑制其他方向的干扰信号，将其用于声音识别系统的信号处理阶段，能够有效的提高识别系统对识别对象的识别率和可靠性。
搜索关键词：	基于十字形声阵列宽带波束形成识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.基于十字形声阵列宽带波束形成的声识别方法,其特征在于包括如下步骤：步骤1、将十字形声阵列对准所需方向采集4通道声音信号；步骤2、对采集到的4通道声音信号进行预处理，包括分帧、加窗；步骤3、对预处理后的每一帧数据进行离散傅里叶变换，离散傅里叶变换后的4通道声音信号根据需要的频带进行频带提取；步骤4、提取的各频带分别在所需方向上进行LSMI‑MVDR波束形成；步骤5、将波束形成后的频域信号进行逆离散傅里叶变换；步骤6、对应分帧时的原则进行帧重叠合成，输出信号；步骤7、对输出信号进行特征提取和分类学习、识别；所述的步骤1：将十字形声阵列的其中一个通道对准声源方向，作为LSMI‑MVDR宽带波束形成的方向，采集4通道声音信号，采样频率记为f_s；所述的步骤2：预处理包括数据的分帧、加窗，对声音信号进行分帧，声音信号每帧选取1024个采样点，帧移为512个采样点；然后采用汉明窗对声音信号进行加窗；所述的步骤3：通过FFT来实现信号的离散傅里叶变换，其中，每一帧信号经过FFT后频率分辨率为第p个通道的第m帧信号经过FFT后的结果为：其中，L＝1024为每一帧的长度，为第p个通道第m帧的信号，k为各个频带的编号，其对应的中心频率为：然后，根据声音信号的频率特性，选取相应的频率带，信号所在的频率带为[f₁，f₂]，则提取FFT后的k所在的区间为

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学，未经杭州电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610409905.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于十字形声阵列宽带波束形成的声识别方法有效

专利文献下载