[发明专利]用于语种识别的约束异方差线性鉴别分析方法有效

专利信息
申请号: 200910081899.3 申请日: 2009-04-14
公开(公告)号: CN101546555A 公开(公告)日: 2009-09-30
发明(设计)人: 张卫强;刘加 申请(专利权)人: 清华大学
主分类号: G10L15/02 分类号: G10L15/02
代理公司: 北京众合诚成知识产权代理有限公司 代理人: 朱 琨
地址: 100084北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 语种 识别 约束 方差 线性 鉴别 分析 方法
【说明书】:

技术领域

发明属于语音识别领域,具体地说,涉及一种约束异方差线性鉴别分析方法,可用于语种识别中高维特征矢量的快速降维和去相关处理。 

背景技术

语种识别是指使用机器从一段语音信号中识别出其语言的种类。语种识别主要用于多语种人机口语对话、语音翻译、跨语言语音检索以及语音侦听等系统。 

目前语种识别中使用最为普遍的特征是MFCC(Mel频率倒谱系数)及其衍生特征。在衍生特征中最为成功的是SDC(偏移差分倒谱)特征,它充分利用了语音信号中的时序信息,提高了特征的鉴别性。SDC特征实际上是由K块一阶差分特征拼接而成的,假设第t帧的基本特征为{cj(t),j=1,2,...,N},其中N为基本特征维数,下标j为维数索引,如附图1所示SDC可以表示为(参考文献Torres-Carrasquillo P A.Language identification using Gaussian mixturemodels[博士论文]Michigan State University,2002.) 

s(iN+i)(t)=cj(t+iS+b)-cj(t+iS-b),j=1,2,...,N;i=0,1,...,K-1 

其中b为计算一阶差分特征时的帧数差,一般取值为1;K为块数,一般取值为7;S为各块之间的偏移帧数,一般取值为3。 

另外还有一种常用的衍生特征是差分特征,一般包括一阶差分和二阶差分。一阶差分特征为 

δj(t)=Σd=1Dd(cj(t+d)-cj(t-d))Σd=1Dd2,]]>j=1,2,...,N 

其中D为差分窗的大小,一般取值为2。同理,由一阶差分进行计算即可得到二阶差分。实验证明,在语种识别中SDC特征比差分特征更为有效。 

SDC特征之所以能取得成功,主要是因为它的时间跨度比较大,含有了较多的时序信息。但是从其计算过程也可以看到它也存在一定的问题:SDC实质上是由若干块一阶差分拼接而成的,拼接以前各帧的特征存在一定的相关性,拼接以后变成了一帧特征内各维之间的相关性,这不利于后端分类器对其建模。为了解决这一问题,可以先将基本特征依次拼接成一个高维的超矢量,然后采用HLDA(异方差线性鉴别分析)方法进行处理,这样既能去除各维之间的相关性,又能降低特征的维数,减轻后端分类器的运算复杂度。但是,由于超矢量维数很高,对于大量数据而言,直接采用HLDA算法运算量极大,按目前数字集成电路芯片的计算能力几乎不能实现。 

发明内容

为了克服现有HLDA算法应用于高维超矢量时存在的问题,本发明提供一种CHLDA(约束异方差线性鉴别分析)算法,大大降低了运算量。使用数字集成电路实现时,与HLDA算法相比,采用本发明可使芯片运算模块节约资源90%以上。 

本发明的特征在于,所述方法是在数字集成电路芯片中按以下步骤实现的(如附图2所示): 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910081899.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top