[发明专利]一种基于改进的并行模型组合的声音事件识别方法有效
申请号: | 201310239724.7 | 申请日: | 2013-06-17 |
公开(公告)号: | CN103310789A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 刘宏;王一;李晓飞 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 并行 模型 组合 声音 事件 识别 方法 | ||
1.一种基于改进的并行模型组合的声音事件识别方法,其步骤包括:
1)根据干净声音事件训练得到GMM高斯混合模型,建立干净声音事件模板;
2)根据噪声数据训练得到GMM高斯混合模型,建立噪声模板;
3)对所述噪声模板和所述干净声音事件模板采用并行模型融合的方法,得到带噪声音事件模板;
4)采样得到带噪声音事件样本信号,根据所述带噪声音事件模板中的参数对样本信号进行声音识别。
2.如权利要求1所述的基于改进的并行模型组合的声音事件识别方法,其特征在于,建立干净声音事件的模板的方法如下:
1)在无噪安静室内的环境下录制声音事件的数据,对录制的声音事件进行预滤波、模数变换后再进行分帧、加窗处理;
2)提取MFCC梅尔倒谱系数特征,训练出声音事件的GMM高斯混合模板。
3.如权利要求1所述的基于改进的并行模型组合的声音事件识别方法,其特征在于,所述高斯混合模型采用EM算法训练并更新高斯模型的参数,训练得到的干净声音事件的GMM参数为λx={wxk,μxk,Σxk},k=1,2···,M,其中,wxk表示干净声音事件模型的混合权重,μxk表示干净声音事件模型的均值,Σxk表示干净声音事件模型的方差,M表示混合高斯的阶数。
4.如权利要求1所述的基于改进的并行模型组合的声音事件识别方法,其特征在于,在室内真实有噪声的环境下获取当前环境中的噪声数据,建立所述噪声模板方法为:提取MFCC特征,建立噪声的GMM模板,得到噪声模板GMM参数为λn={wnk,μnk,Σnk},k=1,2···,M,其中,wnk表示噪声模型的混合权重,μnk表示噪声模型的均值,Σnk表示噪声模型的方差,M表示混合高斯的阶数。
5.如权利要求1所述的基于改进的并行模型组合的声音事件识别方法,其特征在于,对所述噪声模板和所述干净声音事件模板采用并行模型融合的方法如下:
(1)采用离散余弦逆变换将任一模型参数由倒谱域映射到线性谱域,得到对数谱域模型的均值μlog=C-1μ和方差Σlog=C-1Σ(C-1)T,其中,C为离散余弦变换矩阵,μ,Σ分别为模型的倒谱域的均值和方差;
(2)将对数谱域模型中的对数谱域均值和方差通过指数函数变换到线性谱域,
(3)采用改进的并行模型组合方法,将干净声音事件模型参数与噪声模型参数在线性谱域进行融合,为融合后的带噪声音事件模型在线性谱域的均值,为融合后的带噪声音事件模型在线性谱域的方差,其中μxklin为干净声音事件模型经所述步骤(1)(2)变换后的线性谱域的均值,为干净声音事件模型经所述步骤(1)(2)变换后的线性谱域的方差,μnklin为噪声模型经所述步骤(1)(2)变换后的线性谱域的均值,为噪声模型经所述步骤(1)(2)变换后的线性谱域的方差;
(4)将融合后的带噪声音事件模型的线性谱域模型的均值和方差经过上述步骤(2)的逆变换得到对数谱域参数,再经过上述步骤(1)逆变换得到倒谱域的特征参数,得到带噪声音事件模型的均值向量和方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310239724.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:端子结构、挠曲部和头悬架
- 下一篇:商品读取装置及商品读取方法