[发明专利]语音基音周期估计方法和装置有效
申请号: | 201310409433.8 | 申请日: | 2013-09-09 |
公开(公告)号: | CN103474074A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 闫建新;张勇 | 申请(专利权)人: | 深圳广晟信源技术有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L25/48 |
代理公司: | 深圳市顺天达专利商标代理有限公司 44217 | 代理人: | 李琴 |
地址: | 518057 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 基音 周期 估计 方法 装置 | ||
技术领域
本发明涉及语音编码技术,更具体地说,涉及一种语音基音周期估计方法和装置。
背景技术
基音周期是指人发音时声带振动的周期。基音周期是语音编码中一个重要的问题,其准确性将直接影响到语音编码器的编码质量和效率。准确的基音周期性分析,可以在语音编码过程中有效地去除冗余,降低编码的比特数,实现低比特率高质量语音编码。但是,由于语音的特殊性,基音周期的准确搜索会面临如下困难:
(1)语音信号变化十分复杂,声门激励波形不是一个完全的周期脉冲串,并且语音波形的周期是时变的。
(2)在语音的开头和结尾部分并不具有声带振动那样的周期性,有些清浊音等过渡音是很难判定它属于周期或非周期信号,从而也就无法估计基音周期。
(3)要从语音信号中去除声道影响,直接取出仅和声带振动有关的信息比较困难。
(4)在浊音段定义每个基音周期的准确开始和结束这一困难限制了基音的可靠测量,这不仅因为语音信号本身是准周期的(即基音是有变化的),同时也因为波形易受共振峰和噪声等的影响。
(5)在实际应用中,背景噪声会影响基音检测的性能,对于移动通信环境尤为重要,因为波形经常会出现高电平噪声。
(6)基音周期变化范围较大也给准确基音检测带来了一定的困难。
目前,还没有一种通用的方法能精确可靠地提取出语音在任一情况下的基音周期。传统的基音检测方法,可分为时域法和频域法。在时域,传统的基音周期算法包括基于平均幅度差函数(Average Magnitude Difference Function,AMDF)的基音估计算法、基于短时自相关函数(Autocorrelation Function,ACF)基音检测算法。这两种算法可以参见如下文献的介绍:
Chu,Wai C.Speech coding algorithms:foundation and evolution of standardized coders.John Wiley&Sons,Inc.2003,pp.33-45。
在频域的角度,Griffin和Lim提出了一种频域基音周期估计方案(D.W.Griffin,J.S.Lim.Multiband Excitation Vocoder.IEEE Trans ASSP,1988,36(8)),用于多带激励语音编码算法(MBE),这种基音周期估计算法采用闭环分析合成方法,匹配信号频域波形,得到最优基音周期估计。
在实际应用中,基于时域的基音搜索算法由于其算法简单,性能较佳而得到广泛应用。例如在当前的语音编码标准G.729、AMR-WB中,均采取了时域改进的短时自相关函数(ACF)基音检测算法(鲍长春.低码率数字语音编码基础.北京:北京工业大学出版社,2001.2.)。但是,通常时域的ACF方法容易产生“倍频”和“半频”错误,AMDF方法不能有效跟踪语音频率快速变化。频域方法一般采用倒谱法,由于引入对数运算,使计算量大幅度增加,且易受噪音的影响。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种低复杂度、高效的语音基音周期估计方法和装置,能较好地克服基音周期估计中的倍频与半频错误,并能提升抗噪声性能。
本发明解决其技术问题所采用的技术方案是:提出一种语音基音周期估计方法,包括如下步骤:
S1、对语音信号进行除去直流分量、感知加权和信号下采样的预处理;
S2、使用下式计算所述预处理后的语音信号的归一化自相关函数值:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳广晟信源技术有限公司,未经深圳广晟信源技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310409433.8/2.html,转载请声明来源钻瓜专利网。