[发明专利]产生频率增强音频信号的译码器和产生编码信号的编码器在审
申请号: | 201811139723.4 | 申请日: | 2014-01-28 |
公开(公告)号: | CN109509483A | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 弗雷德里克·纳格尔;萨沙·迪施;安德烈娅斯·尼德迈尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L21/0388 | 分类号: | G10L21/0388 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;唐明英 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 参数表示 频率增强 音频信号 译码器 参数生成器 核心信号 边信息 编码信号 编码器 特征提取器 信号估计器 提取特征 提取器 响应 替代 配置 频谱 关联 | ||
一种用于生成频率增强音频信号(120)的译码器和方法以及用于生成编码信号的编码器和方法。所述译码器包括:特征提取器(104),用于自核心信号(100)提取特征;边信息提取器(110),用于提取与该核心信号相关联的选择边信息;参数生成器(108),用于产生用于估计未由所述核心信号(100)限定的所述频率增强音频信号(120)的频谱范围的参数表示,其中所述参数生成器(108)被配置成响应于所述特征(112)提供数个参数表示替代例(702,704,706,708),且其中所述参数生成器(108)被配置成响应于所述选择边信息(712‑718)选择所述参数表示替代例中的一者作为所述参数表示;以及信号估计器(118),用于使用选择的所述参数表示来估计所述频率增强音频信号(120)。
本申请是国家申请号为201480006567.8,国际申请日为2014年1月28日,进入国家日期为2015年7月29日,发明名称为“用于产生频率增强音频信号的译码器、译码方法、用于产生编码信号的编码器以及使用紧密选择边信息的编码方法”的申请的分案申请。
本发明涉及音频编码,且特别涉及在频率增强(即,译码器输出信号相比于编码信号具有较多数目个频带)的上下文中的音频编码。该过程包含带宽扩展、频谱复制或智能间隙填充。
当前的语音编码系统能够在低至6千位/秒的位速率下对宽带(wideband,WB)数字音频内容(亦即,具有高达7kHz至8kHz的频率的信号)编码。经最广泛论述的实例为ITU-T建议G.722.2[1],以及经新近开发的G.718[4、10]及MPEG-D统一语音与音频编码(UnifiedSpeech and Audio Coding,USAC)[8]。G.722.2(亦被称为AMR-WB)及G.718两者使用介于6.4kHz与7kHz间的带宽扩展(BWE)技术以允许基础ACELP核心编码器“集中”于感知上较相关的较低频率(特别是人类听觉系统为相位灵敏处的频率),且由此尤其在极低位速率下实现足够质量。在USAC扩展高效率进阶音频编码(eXtended High Efficiency AdvancedAudio Coding,xHE-AAC)规格中,使用增强频谱带复制(enhanced spectral bandreplication,eSBR)以将音频带宽扩展成超出通常在16千位/秒下低于6kHz的核心编码器带宽。当前现有技术BWE处理通常可被划分成两种概念性方式:
·盲或人工BWE,其中高频(high-frequency,HF)分量仅从解码低频(low-frequency,LF)核心编码器信号重新建构,亦即,无需自编码器传输的边信息。此方案由在16千位/秒及16千位/秒以下的AMR-WB及G.718以及对传统窄带电话语音[5、9、12]操作的一些向前兼容BWE后处理器使用(实例:图15)。
·导引式BWE,其不同于盲BWE之处在于:用于HF内容重新建构的参数中的一些作为边信息被传输至译码器,而非根据译码核心信号来估计。AMR-WB、G.718、xHE-AAC以及一些其它编译码器[2、7、11]使用此方式,但不在极低位速率下(图16)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811139723.4/2.html,转载请声明来源钻瓜专利网。