[发明专利]用于人工扩展语音信号的带宽的方法和装置无效
申请号: | 200910208032.X | 申请日: | 2006-06-30 |
公开(公告)号: | CN101676993A | 公开(公告)日: | 2010-03-24 |
发明(设计)人: | B·盖瑟;P·贾克斯;S·尚德尔;H·塔德伊;A·特勒;P·瓦里 | 申请(专利权)人: | 西门子公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 李家麟 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 人工 扩展 语音 信号 带宽 方法 装置 | ||
本申请是已于2006年6月30日提交的以下PCT国际申请的分案 申请:国际申请号为PCT/EP2006/063742;国家申请号为 200680000799.8;发明名称为“用于人工扩展语音信号的带宽的方法 和装置”。
技术领域
本发明涉及用于人工扩展语音信号的带宽的方法以及装置。
背景技术
语音信号覆盖很宽的频率范围,该频率范围大约从与说话者有关 而位于80至160Hz范围内的语音基频到超过10kHz的频率。但是在 通过特定传输介质如电话而进行的语音通信中,由于带宽有效性的原 因只能传输有限片段,其中保证大约98%的单句清晰度。
对应于特定于电话系统的最低带宽300Hz至3.4kHz,语音信号 基本上可以分为3个频率范围。每个频率范围在此都表征特定的语音 特征以及主观感受。从而大约在300Hz以下的更低的频率基本上出现 在有声的语音段期间,例如对于元音而言。在这种情况下,该频率范 围包含音调分量,尤其是语音基频以及与音高有关的可能若干谐波。
这些低音频率对于主观感受语音信号的音量和动态性很重要。相 应地,人类收听者基于虚拟音调高度的心理声学特性即使在缺乏低音 频率时也能从更高频率范围内的谐波结构中感受到语音基频。从而在 语音活动中从大约300Hz到大约3.4kHz范围内的平均频率基本上存 在于语音信号中。该平均频率通过多个共振峰的随时间变化的频谱音 调色彩以及时间和频率的微观结构表征说出的各个声音或音素。通过 这种方式,平均频率传达了对理解语言很重要的信息的主要部分。
另一方面,在无声的音素中,尤其是对于尖锐的音素如“s”或 “f”更是特别强烈地出现位于约3.4kHz以上的高频分量。所谓的爆 破音如“k”或“t”具有含有强高频分量的宽频谱。因此该信号在该 上频率范围中更多为噪声特性而不是音调特性。在该范围中存在的共 振峰的结构相对而言不随时间变化,但是对不同的说话者有所不同。 高频率分量对语音信号的清晰度、精确度以及自然程度而言具有重要 意义,因为没有高频分量语音就显得很沉闷。此外通过这种高频分量 可以更好地区分摩擦音和辅音,该高频分量由此也保证增强对该语音 的理解。
在通过具有有限带宽的传输信道的语音通信系统来传输语音信 号时,原则上希望而且也一直以此作为目标:能够以最可能的高质量 从发送者向接收者传送待传输的语音信号。但是在此该语音质量是具 有多个部分的主观参数,其中语音信号的理解度对这种语音通信系统 最重要。
在现代数字传输系统中已经可以达到比较高的语音理解度。其中 公知通过为电话带宽增加高频(大于3.4kHz)以及低频(小于300Hz) 可以改善对该语音信号的主观判断。因此在主观质量改善的意义下力 求在用于语音通信的系统中实现比常见电话带宽更大的带宽。在此可 能的措施在于,修正该传输并借助编码方法促使传输带宽加宽或者可 替换地执行人工带宽扩展。通过这种带宽扩展在接收端将频率带宽加 宽到50Hz至7kHz的范围。借助合适的信号处理算法从窄带语音信号 的短片段中利用模式识别的方法确定宽带模型的参数,接着将该参数 用于估计该语音所缺乏的信号分量。在这种方法中从窄带语音信号中 产生频率分量在50Hz至7kHz范围内的宽带对应物,并引起对主观感 受的语音质量的改善。
在当前的语音信号和音频信号编码算法中更多地采用人工带宽 扩展的技术。例如在带宽范围(声学带宽50Hz至7kHz)内采用诸如 AMR-WB(适应性多比率宽带)编码解码算法的语音编码标准。在这种 AMR-WB标准中从低频分量外推出上面的子频带(大约6.4至7kHz的 频率范围)。在这种编码解码方法中通常通过比较小数量的辅助信息 进行带宽扩展。该辅助信息例如可以是滤波器系数或放大系数,其中 滤波器系数例如可以通过LPC(线性预测滤波器)方法产生。该辅助 信息以编码的位流传送给接收器。基于扩展带宽技术的其它标准目前 可以在标准AMR-WB+和扩展的aac+语音/音频编码解码方法中找到。 用于对信息进行编码和解码的方法称为Codec(编解码器),既包括 编码器又包括解码器。每个数字电话,不管是为固网建立的还是为移 动通信网络建立的,都包含这种将模拟信号转换为数字信号并将数字 信号转换为模拟信号的Codec。这种Codec可以用硬件或软件来实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子公司,未经西门子公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910208032.X/2.html,转载请声明来源钻瓜专利网。