[发明专利]语音分析方法和装置以及语音合成方法和装置有效
申请号: | 200710092294.5 | 申请日: | 2007-04-04 |
公开(公告)号: | CN101281744A | 公开(公告)日: | 2008-10-08 |
发明(设计)人: | 孟繁平;双志伟;蒋丹宁;秦勇 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 于静;张亚非 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 分析 方法 装置 以及 合成 | ||
技术领域
本发明涉及语音分析和合成领域,更具体地涉及一种使用DEGG/EGG(微分电声门图/电声门图)信号以及卡尔曼滤波对语音进行分析的方法和装置,以及使用所述语音分析的结果合成语音的方法和装置。
背景技术
在语音生成的理论中,普遍采用以下声源-滤波器模型:
s(t)=e(t)*f(t);
其中,s(t)是语音信号;e(t)是声门源激励;f(t)是声道滤波器的系统函数;t表示时间点;*表示卷积。
图1中示出了这种用于语音生成的声源-滤波器模型。如图所示,来自声门源的输入信号由声道滤波器进行处理(滤波)。同时,声道滤波器受到扰动,即声道滤波器的本身的特征(状态)是随时间变化的。声道滤波器的输出与噪声相叠加,而产生最终的语音信号。
在这个模型中,通常语音信号很容易被记录。然而,声门源与声道滤波器特征都不能直接测量。因此,语音分析中的一个重要问题是,给定一段语音,如何估计出声门源和声道滤波器特征这两者?
这是一个盲解卷积问题,它没有确定的解,除非引入附加的假设,例如关于声门源的预定参数化模型,以及声道滤波器模型。声门源的预定参数化模型包括Rosenberg-Klatt(RK),Liljencrants-Fant(LF),可分别参见D.H.Klatt和L.C.Klatt的“Analysis,synthesis and perceptionof voice quality variations among female and male talkers,”J.Acoust.Soc.Am.,vol.87,no.2,pp.820-857,1990,以及G.Fant,J.Liljencrants和Q.Lin的“A four-parameter model of glottal flow,”STL-QPSR,Tech.Rep.,1985。声道滤波器模型包括LPC即全极点模型(all-pole)和零极点(pole-zero)模型。这些模型的局限性在于,模型过于简单化,只有很少的几个参数,不符合实际信号的情况。
就是说,现有技术的方法一般都是同时估计声门源和声道滤波器参数这两者,但由于这样做非常困难,为了使问题的解更加确定,不得不引入更多的主观假定。例如对声门源应用一些近似的模型,对声道滤波器进行简化和降阶等。所有这些主观的假设和处理都会影响解的精度甚至正确性。
此外,在很多实际应用场景中,语音信号往往是条件不足(ill-conditioned)或采样不足(under-sampled)的,这对现有技术的应用造成限制,使得其无法从语音信号的某个片段提取出完整的信息。
此外,现有技术的方法一般都依赖于语音信号的周期性,因而需要基音周期的标定(pitch marking),即标出每个周期的起止点。但即使全部由人工标定,某些时候也会有歧义。从而影响语音分析的正确性。
因此,显然在本领域中需要一种更为简单、精确、高效和健壮的语音分析和合成方法。
发明内容
本发明所要解决的问题是通过对语音信号进行声源-滤波器分离,而分析该语音信号,并能克服现有技术在这方面的不足。
本发明的方法利用可以直接测量的DEGG/EGG信号代替声门源信号,减少了人为假定,使得结果更真实。同时,使用卡尔曼滤波并优选地使用双向卡尔曼滤波过程,由DEGG/EGG信号和语音信号估计出声道滤波器的特征,即其随时间变化的状态。
根据本发明的一个方面,提供了一种语音分析方法,包括以下步骤:获取语音信号和相应的DEGG/EGG信号;将所述语音信号视为声源-滤波器模型中以所述DEGG/EGG信号为输入的声道滤波器的输出;以及由作为输出的所述语音信号和作为输入的所述DEGG/EGG信号估计所述声道滤波器的特征。
优选地,所述声道滤波器特征由所述声道滤波器在选定时间点的状态向量表示,且所述估计步骤是使用卡尔曼滤波完成的。
优选地,所述卡尔曼滤波基于:
状态方程
xk=xk-1+dk,和
观测方程
vk=ekTxk+nk,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710092294.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高强度螺纹钢筋及其制备工艺
- 下一篇:与非闪存器及其管理方法