[发明专利]语音处理系统无效
申请号: | 97199829.9 | 申请日: | 1997-10-13 |
公开(公告)号: | CN1238058A | 公开(公告)日: | 1999-12-08 |
发明(设计)人: | J·N·霍姆斯 | 申请(专利权)人: | 英国国防部 |
主分类号: | G10L9/06 | 分类号: | G10L9/06 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 栾本生,李亚非 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 系统 | ||
本发明涉及语音处理系统,更具体而言,涉及一种利用与被称为共振峰频率的语音发音相关的人的声音的谐振模式的系统。
共振峰频率通常作为在语音信号的短时谱中的峰值出现。许多年来,一直公认它们与有关的语音的发音重要性密切相关。这种关系意味着在语音信号的自动处理中有许多应用,为此,一种共振峰频率测量的有效方法是有用的,例如:
(a)共振峰声码器,也就是用于对低位速率语音传输编码的设
备;
(b)共振峰频率随时间变化的可见显示,以便帮助聋人解释语
音,或帮助他们语音训练;
(c)从每个人的语音自动鉴别身份;和
(d)语音信号分析,供输入到自动语音辨认系统。
这些应用的要求可以通过在有规则的时间间隔上从相继的谱截面确定共振峰频率得到满足。另外,确定有关的共振峰的幅度也是有用的,因为语音声音的发音质量取决于两者。对于某些声音(特别是元音),相关的共振峰幅度很大程度上由共振峰频率的型式所确定。可是,对于大多数辅音的相关幅度将与这些典型的元音不大相同,甚至连元音,它们也将随声音的用力程度和说话者的不同而变化。
很遗憾,尽管共振峰信息是有用的,自动共振峰测量是人所共知的困难。这种困难的主要原因是由于语音处理引起的,语音处理包括短持续时间声音的分析,以便产生短时谱截面,但规定共振峰的谱峰值并不一定清楚地出现在这样一个截面中。语音产生的声学理论指明,在理想的条件下人的声道(Vocal tract)有间隔大约1KHZ的平均频率上有一系列的谐振模式,实际的谐振频率由在任何特定时间上颚,舌,唇和其它发音器官的精确位置来确定。共振峰固有地与人的发声系统(Vocal system)的声音谐振有关这样一个事实意味着当发声器官移动以产生不同语音声音时,它们的频率通常将随时间平滑地改变。
在确定语音的发音性质中共振峰频率的影响几乎完全仅仅与这些谐振中的最低三个有关(通常称为F1,F2和F3),在第三个以上的谐振是不重要的。事实上F4以上的谐振因为带宽的限制通常不可能在语音信号中检测到。在电话带宽信号的情况下,甚至F4常常不出现在可得到的信号中。
为什么关于语音产生的精确理论在实际的语音发音期间常常得不到理论共振峰的清淅的图形的原因有许多。首先,理论论述声道的响应,并不考虑激发该声道的声源的谱性质。主要的声源是在振动着的发音区(Vocal folds)之间的空气流,和由气流通过声道中的阻塞物时引起的扰动噪声。大多数时间内,这些源具有一种这样的谱结构,它不可能掩蔽声道响应的谐振型式。这些源的谱趋势作为一个频率的函数或者是相当平坦(在扰动噪声的情况下),或者随着频率的增加在强度上通常的下降(在发音区之间的气流的情况下)。然而,在后一种情况下,尤其是对于某些说话者,存在这样的情况,通常平滑的谱趋势在某些频率上被干扰,有时带有少量的谱峰,但最通常的情况是在谱中带有发音下降,如果这样一种下降与声道的谐振相符合,共振峰的预期的谱峰几乎完全可被掩蔽。
辨认共振峰谱峰困难的第二个原因,尤其是在某些辅音声音中,是在于声道在某些中间点可能被严重阻塞,以致在声音上几乎完全分成两个基本独立的部分。对于这些语音声音的类型,声源通常是由在阻塞时产生的扰动引起的。在这些情况下从口中发出的声音主要受由阻塞引起的声道的谐振结构的影响,与后腔有关的共振峰(标记为F1)被如此微弱地激发,以致它们通常根本不出现在发出的语音谱中。在这些情况下,F1并没有感觉上的意义,但是出于连续性的考虑将其它的谐振与适当的较高共振峰数目联合是有利的。共振峰频率的特性作为一个时间函数用共振峰轨线来描述;每根共振峰轨线是一系列各个单独的共振峰频率如F1作为一个时间函数的相继的值,因此对于共振峰频率F1,F2,F3有一组三个共振峰轨线。连续性考虑意味着穿过元音/辅音边界的共振峰轨线的连续性。
扰动激发的辅音声音对于共振峰分析来说具有进一步的困难,因为在这些声音期间喉门(在喉中发音区之间的空间)开得宽,所以由于耦合到副喉门系统(支气管和肺)引起共振峰谐振较大的阻尼。
共振峰分析的第三个困难尤其是针对高音调的说话者,对于他们来说,发音区振动频率可以是相当高。如400Hz或甚至更高。这种高的频率产生的谐波其间隔可以大于共振峰谐振的谱带宽。共振峰的谱峰可位于两个谐波之间,因而并不明显,由谐波引起的谱峰可能被误认为是共振峰。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英国国防部,未经英国国防部许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/97199829.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:大晶体沸石的合成方法
- 下一篇:发送终端接口用户数据和状态信息的方法和设备