[发明专利]使用共振峰增强提取话音共振峰轨迹的方法无效
申请号: | 200710023479.0 | 申请日: | 2007-06-05 |
公开(公告)号: | CN101067929A | 公开(公告)日: | 2007-11-07 |
发明(设计)人: | 王宏;潘金贵 | 申请(专利权)人: | 南京大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L19/04;G10L19/00 |
代理公司: | 南京天翼专利代理有限责任公司 | 代理人: | 汤志武;王鹏翔 |
地址: | 210093*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 共振 增强 提取 话音 轨迹 方法 | ||
技术领域
本发明涉及一种语音信号共振峰轨迹的提取方法,尤其涉及一种能够同时准确提取第一、第二、第三、第四和第五共振峰轨迹的简便方法。
背景技术
共振峰是表征语音信号特征的基本参数之一,它在语音信号合成、语音识别和语音编码等方面起着重要作用。共振峰可以等效为声道系统函数的复极点对,由于人的声道平均长度约为17cm,而语音信号的能量主要集中在0~5kHz,因此语音通常包含4到5个稳定的幅度较强的共振峰。
目前,线性预测分析(LPC)法仍然是计算速度比较快而又较为有效的共振峰频率估计方法之一。声道的系统函数可以由一组线性预测系数(LPC)唯一确定,因此通过LPC分析能估计出声道调制的效果,即获得共振峰参数。具体来说,LPC分析共振峰频率有两种方式,一种是通过求解逆滤波器A(z)的分母多项式的复根来得到共振峰。但是,高阶多项式的根无统一表达式,只能用近似法(例如牛顿法、林士鄂-赵访熊法等)求解,因而该方法的运算量较大,且求根的递归过程有可能发散,所以已不被广泛使用;另一种是峰值检测法,即利用LPC系数求出声道系统函数的LPC谱,然后通过搜索LPC谱中的峰值位置来得到共振峰频率。由于共振峰可出现在任何频率上,所以现有技术已尝试在确认最有可能的共振峰之前,限制查找空间。在现有技术的其它共振峰轨迹提取系统中,也已尝试通过将语音帧的频谱内容与一组已由专家识别出其共振峰的频谱模板相比较来减少查找空间。虽然减少查找空间的系统运行得很高效,但是它们易于发生错误,因为在减少查找空间的同时它们也会把真正的共振峰频率排除在外。
LPC分析在大多数情况下能成功提取语音的共振峰参数,但是在某些情况下会发生下列现象,从而造成共振峰频率的误判或漏判。(1)假峰干扰:语音信号的LPC谱峰一般是由共振峰引起的,但有时也会出现假峰。例如,为近视声门、唇辐射和鼻腔的谱效应,通常会在LPC模型中附加2~4个极点,这就有可能在LPC频谱上造成假峰。这个假峰有时会被当作共振峰,从而引起各阶共振峰的误判。虽然共振峰的带宽比较窄,一般小于300Hz,可以设置门限来排除假峰,但由于LPC算法对共振峰带宽的估计并不精确,所以效果不甚理想。(2)共振峰丢失:有些语音信号的共振峰强度较弱,带宽较大;或者由于鼻腔的影响,共振峰的强度被削弱,这种情况经常发生在第二共振峰上。这时从频谱上看不到明显的峰,即使通过求根法求出相应的极点,也会因其Q值过小而被丢弃。(3)共振峰合并:有时侯两个共振峰靠得很近,如果它们的强度相近而带宽又较大,就会合并成一个峰;如果其中一个强度较强而另一个较弱的话,那么较弱的一个就会被较强的一个所掩盖,或发生“骑峰”现象。这在通过寻找频谱上的极值来提取共振峰时将引起误判。尽管可以利用FFT(快速傅立叶变换)谱辅助完成共振峰的提取和判决,但还是难以在所需频率范围内精确地提取共振峰。
微软公司申请了中国专利“使用残差模型用于共振峰追踪的方法和装置”,其申请(专利)号为:200410034242.9,申请日:2004.04.01;公开(公告)号:CN1534596;公开(公告)日:2004.10.06。该发明公开了一种共振峰追踪的方法:一种追踪共振峰的方法定义包含待查找的共振峰组的一个共振峰查找空间。通过使用码本查找整个共振峰查找空间来确认说话语音中第一帧的共振峰,而对余下的各帧使用码本和相邻帧间的连续性制约来查找同样的空间。在一个实施例中,通过映射共振峰组到特征向量以及应用该特征向量到一模型来确认共振峰。也可通过应用动态规划,查找最优地满足该模型所要求的连续性制约的最佳序列来确认共振峰。
LG电子株式会社了中国专利“共振峰析取方法”,其申请(专利)号为:200410083512.5;申请日:2004.10.08;公开(公告)号:CN1606062;公开(公告)日:2005.04.13。该发明公开了一种共振峰析取方法:在用较少计算复杂性、能够精确地按话音的谐振频率获得共振峰的共振峰析取法中,所述方法包括通过谱峰值采集法搜索最大值,判断符合获得的最大点处的零点的共振峰数目是否为两个,并且当共振峰数目判断为两个时,通过根精加工分析相关根。通过应用柯西积分公式判断共振峰的数目,其中不重复应用柯西积分公式,而仅在z域内的最大值的周围部分中应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710023479.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可调PVA胶棉的拖把
- 下一篇:电动车双电机框式组合驱动装置