[发明专利]产生频率增强音频信号的译码器和产生编码信号的编码器在审

申请号：	201811139723.4	申请日：	2014-01-28
公开（公告）号：	CN109509483A	公开（公告）日：	2019-03-22
发明（设计）人：	弗雷德里克·纳格尔;萨沙·迪施;安德烈娅斯·尼德迈尔	申请（专利权）人：	弗劳恩霍夫应用研究促进协会
主分类号：	G10L21/0388	分类号：	G10L21/0388
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	王萍;唐明英
地址：	德国***	国省代码：	德国;DE
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	参数表示频率增强音频信号译码器参数生成器核心信号边信息编码信号编码器特征提取器信号估计器提取特征提取器响应替代配置频谱关联
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种用于生成频率增强音频信号(120)的译码器和方法以及用于生成编码信号的编码器和方法。所述译码器包括：特征提取器(104)，用于自核心信号(100)提取特征；边信息提取器(110)，用于提取与该核心信号相关联的选择边信息；参数生成器(108)，用于产生用于估计未由所述核心信号(100)限定的所述频率增强音频信号(120)的频谱范围的参数表示，其中所述参数生成器(108)被配置成响应于所述特征(112)提供数个参数表示替代例(702,704,706,708)，且其中所述参数生成器(108)被配置成响应于所述选择边信息(712‑718)选择所述参数表示替代例中的一者作为所述参数表示；以及信号估计器(118)，用于使用选择的所述参数表示来估计所述频率增强音频信号(120)。

本申请是国家申请号为201480006567.8，国际申请日为2014年1月28日，进入国家日期为2015年7月29日，发明名称为“用于产生频率增强音频信号的译码器、译码方法、用于产生编码信号的编码器以及使用紧密选择边信息的编码方法”的申请的分案申请。

本发明涉及音频编码，且特别涉及在频率增强(即，译码器输出信号相比于编码信号具有较多数目个频带)的上下文中的音频编码。该过程包含带宽扩展、频谱复制或智能间隙填充。

当前的语音编码系统能够在低至6千位/秒的位速率下对宽带(wideband,WB)数字音频内容(亦即，具有高达7kHz至8kHz的频率的信号)编码。经最广泛论述的实例为ITU-T建议G.722.2[1]，以及经新近开发的G.718[4、10]及MPEG-D统一语音与音频编码(UnifiedSpeech and Audio Coding,USAC)[8]。G.722.2(亦被称为AMR-WB)及G.718两者使用介于6.4kHz与7kHz间的带宽扩展(BWE)技术以允许基础ACELP核心编码器“集中”于感知上较相关的较低频率(特别是人类听觉系统为相位灵敏处的频率)，且由此尤其在极低位速率下实现足够质量。在USAC扩展高效率进阶音频编码(eXtended High Efficiency AdvancedAudio Coding,xHE-AAC)规格中，使用增强频谱带复制(enhanced spectral bandreplication,eSBR)以将音频带宽扩展成超出通常在16千位/秒下低于6kHz的核心编码器带宽。当前现有技术BWE处理通常可被划分成两种概念性方式：

·盲或人工BWE，其中高频(high-frequency,HF)分量仅从解码低频(low-frequency,LF)核心编码器信号重新建构，亦即，无需自编码器传输的边信息。此方案由在16千位/秒及16千位/秒以下的AMR-WB及G.718以及对传统窄带电话语音[5、9、12]操作的一些向前兼容BWE后处理器使用(实例：图15)。

·导引式BWE，其不同于盲BWE之处在于：用于HF内容重新建构的参数中的一些作为边信息被传输至译码器，而非根据译码核心信号来估计。AMR-WB、G.718、xHE-AAC以及一些其它编译码器[2、7、11]使用此方式，但不在极低位速率下(图16)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会，未经弗劳恩霍夫应用研究促进协会许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811139723.4/2.html，转载请声明来源钻瓜专利网。

上一篇：回声消除方法、回声消除装置、电子设备和可读介质
下一篇：一种婴儿啼哭原因的预测方法及装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]产生频率增强音频信号的译码器和产生编码信号的编码器在审

专利文献下载