[发明专利]一种基于神经网络的高斯混合模型的噪声分类方法无效
申请号: | 201110069034.2 | 申请日: | 2011-03-22 |
公开(公告)号: | CN102693724A | 公开(公告)日: | 2012-09-26 |
发明(设计)人: | 张燕;姜志鹏;姚健东;唐加能;陈存宝;黄艳;蔡群;李国华 | 申请(专利权)人: | 张燕 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/02;G10L15/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211169 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 混合 模型 噪声 分类 方法 | ||
技术领域
本发明涉及一种说话人识别方法,特别涉及一种基于神经网络的高斯混合模型的噪声分类方法。
背景技术
降低各类城市环境噪声是现代化城市环境保护的重要指标之一,直接影响到城市形象。城市环境噪音监测系统是城市必不可少的公用设施。噪音监测系统的应用,可提高环境保护的硬件水平,增强城市环境保护的可靠性和可控性。根据在城市不同点的不间断监测,能实时发现违反噪音分贝的现象,提高环境保护的工作效率。
在噪声分类的方法上,基于高斯混合模型(GMM)方法越来越受到重视,由于它具有识别率高,训练简单,训练数据量要求不大等优点,已经成为目前主流的噪声分类方法。由于高斯混合模型(GMM)具有很好的表示数据的分布的能力,只要有足够多的项,足够多的训练数据,GMM就能够逼近任何分布模型。但是,实际使用GMM时存在几个问题。首先,GMM没有利用语音的时间信息,训练和识别的结果与特征向量的输入顺序无关;其次,在GMM训练时,我们总是假设特征向量互相是独立的,这明显不合理;另外,由于我们在选择GMM模型时,混合项数目的选取也没有好的指导原则,要取得好的结果就要求高斯混合项足够多。
神经网络在噪声分类方面也占有重要的位置,多层感知器、射线基网络和自联想神经网络等已经成功应用于噪声分类,它充分利用了特征向量序列的时序信息,对特征向量进行学习和变换,使变换后的特征向量以某种方式(通常为极小最小二乘法)逼近目标向量。但是目前GMM和自联想神经网络(AANN)只是单独用于噪声分类,还没有出现结合二者各自的优点,从而更好地提高噪声分类效果的方法出现。
发明内容
本发明的目的就在于解决现有技术的缺陷,提出了一种基于神经网络的高斯混合模型的噪声分类方法。本发明的技术方案是:
一种基于神经网络的高斯混合模型的噪声分类方法,其包括以下步骤:
(1)预处理与特征提取;
首先,使用了基于能量和过零率的方法进行静音检测,并对噪声信号进行预加重,分帧,并进行线性预测(LPC)分析,然后从得到的LPC系数中求出倒谱系数作为噪声分类的特征向量。
(2)训练;
训练时,将提取出的特征向量经过延迟后作为AANN的输入,AANN学习特征向量的结构,提取特征向量序列的时间信息。然后把学习结果以残差特征向量的形式提供给GMM,采用最大期望(EM)准则进行GMM模型训练,并且利用带惯性的向后反演方法更新AANN网络的权系数。具体训练过程如下:
(2-1)确定GMM模型和AANN结构:
一个M阶GMM的概率密度函数是由M个高斯概率密度函数加权求和得到的,可以用如下形式表示:
上式中xt为D维特征向量,这里D=13;bi(xt)是成员密度函数,其为均值矢量为ui,协方差矩阵为∑i的高斯函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张燕,未经张燕许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110069034.2/2.html,转载请声明来源钻瓜专利网。