[发明专利]音调原型波形借助于时间同步波形内插的语音合成无效
申请号: | 99815489.X | 申请日: | 1999-11-12 |
公开(公告)号: | CN1348582A | 公开(公告)日: | 2002-05-08 |
发明(设计)人: | A·达斯;E·L·T·乔依 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 上海专利商标事务所 | 代理人: | 赵国华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音调 原型 波形 借助于 时间 同步 内插 语音 合成 | ||
发明背景
I.发明领域
本发明总体涉及语音处理领域,具体来说,涉及一种音调原型波形借助于时间同步波形内插(TSWI)的语音合成方法和装置。
II.技术背景
利用数字技术进行的话音传输业已得到推广,尤其在长距离数字无线电话应用中更是如此。这进而在维持所觉察的重建语音质量的同时确定可在一个信道上发送的最低信息量方面产生兴趣。若语音通过简单的取样和数字化发送,便需要64千位/秒(kbps)量级的数据速率来实现现有模拟电话的语音质量。但通过利用语音合成,并接着进行相应的编解码、传输以及接收机处的重新合成,可实现数据速率显著的缩减。
采用提取涉及人类语音生成模型的参数的技术来压缩语音的器件便是所说的语音编解码器。语音编解码器将来向语音信号分成时间块或分析帧。语音编解码器通常包括一编码器和一解码器,或一编码解码器。该编码器分析该来向语音帧以提取某种相关参数,接着将参数量化为二进制表现形式,即一组数字位或一二进制数据分组。该数据分组经通信信道发送给一接收机和一解码器。该解码器处理此数据分组,对它们去量化以生成参数,接着利用去量化的参数重新合成该语音帧。
语音编解码器的功能是通过消除语音中固有的全部自然冗余,将经过数字化的语音信号压缩为一低位速率信号。该数字压缩是通过用一组参数代表所输入语音帧并采用量化而用一组数字位代表该参数来实现的。若所输入语音帧具有的数字位位数为Ni,语音编解码器所生成的数据分组具有的数字位位数为No,该语音编解码器所实现的压缩因数便为Cr=Ni/No。挑战在于在实现目标压缩因数的同时保持所解码语音的高话音质量。语音编解码器的性能取决于(1)语音模型或者上面所述分析和合成处理的组合表现如何,以及(2)在每帧No位的目标位速率下参数量化处理表现如何。语音模型的目标因而是以每一帧一小组参数来俘获语音信号要素或目标话音质量。
语音编解码器,若其模型为一时间域模型,便称为一时域编解码器。一公知的例子是L.B.Rabiner和R.W.Schafer的《语音信号的数字处理》396-453(1978)中说明的码激活线性预测(CELP)编解码器,在此全部结合作为参照。一CELP编解码器中,靠找出短期共振峰滤波器系数的线性预测(LP)分析来消除语音信号中的短期相关性或冗余。将短期预测滤波器应用到来向语音帧,生成的是一LP余量信号,它进一步用长期预测滤波器参数和后续随机码簿来使之模型化和量化。这样,CELP编解码器便将时域语音波形的编码任务分成对LP短期滤波器系数进行编码和对LP余量进行编码的诸多分开任务。目标在于生成一种与所输入语音波形非常相像的经过合成的输出语音波形。要正确保存该时域波形,CELP编解码器进一步将该余量帧分成较小块或分帧,并对各个分帧继续分析一合成方法。这需要每一帧大的数字位数目No,因为有许多参数对每一分帧进行量化。每一帧可用的数字位数目No对于8kbps以上编解码位速率来说足够大时,CELP编解码器通常传递的质量便十分出色。
波形内插(WI)是一种显现的语音编解码技术,其中对每一语音帧用可资利用的数字位对M数目的原型波形加以提取和编码。所输出的语音是靠某些现有波形内插技术根据所解码的原型波形经过合成得到的。各种WI技术在W.Bastiaan Kleijn和Jesper Haagen的《语音编解码以及合成》176-205(1995)中有所说明,在此全部结合作为参照。现有的WI技术还在美国专利U.S.Pat.No.:5,517,595中有所说明,在此全部结合作为参照。但这种现有WI技术中,为了要传递正确结果,需要每一帧提取超过一个原型波形。而且,不存在对所重组波形提供时间同步的机制。由于这种原因,所合成的输出WI波形并不保证与原始的输入波形调准。
目前有一股研究兴趣和强烈的商业需求浪潮来开发一种工作于中、低位速率(即在2.4至4kbps甚至更低范围)的高质量语音编解码器。应用领域包括无线电话、卫星通信、互联网电话、种种多媒体以及话音流应用、话音邮件以及其他话音存储系统。驱动力是对高容量的需求和在分组丢失情形下对稳健性能的需要。近来种种语音编解码标准化努力是推进低速率语音编解码算法研发的另一直接驱动力。低速率语音编解码器对每一允许的应用带宽创造出更多信道或用户,与适当的信道编解码的附加层相耦连的低速率语音编解码器可适应编解码器规范中的全部位预算,并在信道差错状况下给予一稳健性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/99815489.X/2.html,转载请声明来源钻瓜专利网。