[发明专利]噪声稳健语音译码模式分类有效

专利信息
申请号: 201280025143.7 申请日: 2012-04-12
公开(公告)号: CN103548081A 公开(公告)日: 2014-01-29
发明(设计)人: 伊桑·罗伯特·杜尼;维韦克·拉金德朗 申请(专利权)人: 高通股份有限公司
主分类号: G10L25/93 分类号: G10L25/93;G10L25/78;G10L19/22;G10L19/025
代理公司: 北京律盟知识产权代理有限责任公司 11287 代理人: 宋献涛
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 噪声 稳健 语音 译码 模式 分类
【说明书】:

相关申请案

本申请案涉及2011年5月24日申请的名为“噪声稳健语音译码模式分类(Noise-Robust Speech Coding Mode Classification)”的第61/489,629号美国临时专利申请案且主张其优先权。

技术领域

本发明大体上涉及语音处理的领域。更特定来说,所揭示配置涉及噪声稳健语音译码模式分类。

背景技术

通过数字技术进行的话音发射已变得普遍,特别是在长距离及数字无线电电话应用中。此情形又已产生对在维持经重建构语音的感知质量的同时确定可经由信道而发送的最少量的信息的兴趣。如果通过简单地取样及数字化来发射语音,则需要大约每秒64千位(kbps)的数据速率以实现常规模拟电话的语音质量。然而,经由使用语音分析,接着使用适当译码、发射及在接收器处的重新合成,可实现数据速率的显著缩减。语音分析可被执行得越准确,则数据可被编码得越适当,因此缩减数据速率。

使用通过提取关于人类语音产生模型的参数来压缩语音的技术的装置被称为语音译码器。语音译码器将传入语音信号划分成时间块或分析帧。语音译码器通常包括编码器及解码器,或编解码器。编码器分析传入语音帧以提取某些相关参数,且接着将所述参数量化成二进制表示,即,量化到位集合或二进制数据包。数据包是经由通信信道发射到接收器及解码器。解码器处理数据包、解量化数据包以产生参数,且接着使用经解量化参数来重新合成语音帧。

现代语音译码器可使用多模式译码方法,所述方法根据输入语音的各种特征将输入帧分类成不同类型。多模式可变位速率编码器使用语音分类以使用每帧最小数目个位来准确地俘获及编码高百分比的语音区段。更准确的语音分类产生较低的平均经编码位速率及较高质量的经解码语音。先前,语音分类技术仅针对经隔离语音帧考虑最小数目个参数,从而产生很少且不准确的语音模式分类。因此,需要高性能语音分类器以在变化的环境条件下正确地分类众多语音模式,以便实现多模式可变位速率编码技术的最大性能。

发明内容

附图说明

图1为说明用于无线通信的系统的框图;

图2A为说明可使用噪声稳健语音译码模式分类的分类器系统的框图;

图2B为说明可使用噪声稳健语音译码模式分类的另一分类器系统的框图;

图3为说明噪声稳健语音分类的方法的流程图;

图4A到4C说明用于噪声稳健语音分类的模式决策制订过程的配置;

图5为说明用于调整用于分类语音的阈值的方法的流程图;

图6为说明用于噪声稳健语音分类的语音分类器的框图;

图7为说明具有相关联参数值及语音模式分类的经接收语音信号的一个配置的时间线曲线图;及

图8说明可包含于电子装置/无线装置内的某些组件。

具体实施方式

语音译码器的功能是通过移除语音中所固有的所有自然冗余而将经数字化语音信号压缩成低位速率信号。通过用参数集合来表示输入语音帧且使用量化以用位集合来表示参数而实现数字压缩。如果输入语音帧具有Ni数目个位且通过语音译码器产生的数据包具有No数目个位,则通过语音译码器实现的压缩因数为Cr=Ni/No。挑战是保持经解码语音的高话音质量,同时实现目标压缩因数。语音译码器的性能取决于:(1)语音模型或上文所描述的分析及合成过程的组合执行得有多好;及(2)在每帧No个位的目标位速率下参数量化过程执行得有多好。因此,语音模型的目标是在针对每一帧具有小参数集合的情况下俘获语音信号的本质或目标话音质量。

语音译码器可经实施为时域译码器,其试图通过采用高时间分辨率处理以每次编码小语音区段(通常为5毫秒(ms)的子帧)来俘获时域语音波形。对于每一子帧,通过各种搜索算法来找到来自码簿空间的高精确度代表。或者,语音译码器可经实施为频域译码器,其试图用参数集合(分析)来俘获输入语音帧的短期语音频谱且采用对应合成过程以从频谱参数来重新建立语音波形。参数量化器根据A.Gersho及R.M.Gray的“向量量化和信号压缩(Vector Quantization and Signal Compression)”(1992年)中所描述的量化技术通过用码向量的经存储表示来表示参数而保持所述参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201280025143.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top