[发明专利]用于语种识别的约束异方差线性鉴别分析方法有效
申请号: | 200910081899.3 | 申请日: | 2009-04-14 |
公开(公告)号: | CN101546555A | 公开(公告)日: | 2009-09-30 |
发明(设计)人: | 张卫强;刘加 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02 |
代理公司: | 北京众合诚成知识产权代理有限公司 | 代理人: | 朱 琨 |
地址: | 100084北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语种 识别 约束 方差 线性 鉴别 分析 方法 | ||
技术领域
本发明属于语音识别领域,具体地说,涉及一种约束异方差线性鉴别分析方法,可用于语种识别中高维特征矢量的快速降维和去相关处理。
背景技术
语种识别是指使用机器从一段语音信号中识别出其语言的种类。语种识别主要用于多语种人机口语对话、语音翻译、跨语言语音检索以及语音侦听等系统。
目前语种识别中使用最为普遍的特征是MFCC(Mel频率倒谱系数)及其衍生特征。在衍生特征中最为成功的是SDC(偏移差分倒谱)特征,它充分利用了语音信号中的时序信息,提高了特征的鉴别性。SDC特征实际上是由K块一阶差分特征拼接而成的,假设第t帧的基本特征为{cj(t),j=1,2,...,N},其中N为基本特征维数,下标j为维数索引,如附图1所示SDC可以表示为(参考文献Torres-Carrasquillo P A.Language identification using Gaussian mixturemodels[博士论文]Michigan State University,2002.)
s(iN+i)(t)=cj(t+iS+b)-cj(t+iS-b),j=1,2,...,N;i=0,1,...,K-1
其中b为计算一阶差分特征时的帧数差,一般取值为1;K为块数,一般取值为7;S为各块之间的偏移帧数,一般取值为3。
另外还有一种常用的衍生特征是差分特征,一般包括一阶差分和二阶差分。一阶差分特征为
其中D为差分窗的大小,一般取值为2。同理,由一阶差分进行计算即可得到二阶差分。实验证明,在语种识别中SDC特征比差分特征更为有效。
SDC特征之所以能取得成功,主要是因为它的时间跨度比较大,含有了较多的时序信息。但是从其计算过程也可以看到它也存在一定的问题:SDC实质上是由若干块一阶差分拼接而成的,拼接以前各帧的特征存在一定的相关性,拼接以后变成了一帧特征内各维之间的相关性,这不利于后端分类器对其建模。为了解决这一问题,可以先将基本特征依次拼接成一个高维的超矢量,然后采用HLDA(异方差线性鉴别分析)方法进行处理,这样既能去除各维之间的相关性,又能降低特征的维数,减轻后端分类器的运算复杂度。但是,由于超矢量维数很高,对于大量数据而言,直接采用HLDA算法运算量极大,按目前数字集成电路芯片的计算能力几乎不能实现。
发明内容
为了克服现有HLDA算法应用于高维超矢量时存在的问题,本发明提供一种CHLDA(约束异方差线性鉴别分析)算法,大大降低了运算量。使用数字集成电路实现时,与HLDA算法相比,采用本发明可使芯片运算模块节约资源90%以上。
本发明的特征在于,所述方法是在数字集成电路芯片中按以下步骤实现的(如附图2所示):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910081899.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:带匀盘的铸造砂斗
- 下一篇:一种链条上套筒长度挑选装置