[发明专利]用于语种识别的时频二维倒谱特征提取方法有效

专利信息
申请号: 200810103328.0 申请日: 2008-04-03
公开(公告)号: CN101256768A 公开(公告)日: 2008-09-03
发明(设计)人: 张卫强;刘加 申请(专利权)人: 清华大学
主分类号: G10L15/02 分类号: G10L15/02
代理公司: 暂无信息 代理人: 暂无信息
地址: 100084北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 用于语种识别的时频二维倒谱特征提取方法涉及一种用于语种识别的时频二维倒谱特征提取方法,其特征在于所述方法首先分帧计算语音信号子带能量,多帧子带能量拼接后得到时频分布矩阵,然后进行二维DCT变换,去除矩阵时间方向和频率方向的相关性,再对变换后的系数进行重排列并降低维数,可得到最后特征。该特征既利用了语音的短时平稳性,又提取了用于语种识别的长时信息。可以用于语种识别。
搜索关键词: 用于 语种 识别 二维 特征 提取 方法
【主权项】:
1.用于语种识别的时频二维倒谱特征提取方法,其特征在于所述方法是在数字集成电路芯片中按以下步骤实现的:步骤(1):对语音信号进行零均值化和预加重,其中零均值化是指整段语音减去其均值,预加重是对语音进行高通滤波,滤波器传输函数为H(z)=1-0.975z-1;步骤(2):对语音信号按帧长20ms,帧移10ms进行分帧处理;步骤(3):按以下步骤建立一个同时反映语音短时平稳性和语种长时信息的二维时频分布矩阵:步骤(3.1):对所述语音信号加汉明窗,得到数据{x(m),m=0,1,...,M-1},M为一帧数据点数;步骤(3.2):对加加汉明窗的数据做DFT变换(离散傅立叶变换),得到:X(ωk)=Σm=0M-1x(m)e-j2πMmk]]>其中ωk代表频率,k代表频率标号;步骤(3.3):按Mel频标在频率域中用下式计算每帧内F个三角窗的子带能量ef,F=24:ef=1Uf-Lf+1Σk=LfUf|X(ωk)|2]]>其中Uf和Lf分别为第f个子带的上下边界,再把F个子带能量组成一个矢量e:e=[e0,e1,…,eF-1]T其中上标T表示转置;步骤(3.4):取步骤(3.3)中T帧矢量并列在一起,形成一个二维时频分布矩阵E(t),T=19:E(t)=[e(t),e(t+1),···,e(t+T-1)]]]>步骤(4):对矩阵E(t)进行二维DCT(离散余弦变换),得到二维倒谱系数:C(p,q)=γpγqΣτ=0T-1Σf=0F-1ef(t+τ-1)cosπ(2τ+1)p2Tcosπ(2f+1)q2F]]>其中τ和f为求和变量,γp和γq为归一化系数:γp=1/T,p=02/T,p1,]]>γq=1/F,q=02/F,q1]]>步骤(5):选取作为矩阵E(t)主要分量的左上角部分的元素作为特征,用TFC表示,则把左上角部分排列为矢量的重排公式为:TFC((p+q)2+3p+q2)=C(p,q).]]>
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810103328.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top