[发明专利]编码设备、解码设备、编码方法和解码方法有效
申请号: | 200710152908.4 | 申请日: | 2003-04-28 |
公开(公告)号: | CN101131820A | 公开(公告)日: | 2008-02-27 |
发明(设计)人: | 押切正浩 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L19/14 | 分类号: | G10L19/14 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 邸万奎 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码 设备 解码 方法 | ||
本发明是申请日为2003年4月28日,申请号为03809372.3的发明专利申请“编码设备、解码设备、编码方法和解码方法”的分案申请。
技术领域
本发明涉及对诸如音频信号或语音信号之类的声信号进行高效压缩编码的编码设备、解码设备、编码方法和解码方法,尤其涉及即使根据一部分编码信息也能够解码音频或语音的、适合于可伸缩(scalar)编码和解码的编码设备、解码设备、编码方法和解码方法。
背景技术
以低位速率压缩音频信号或语音信号的声音编码技术对于有效利用移动通信中的无线电和记录媒体是非常重要的。编码语音信号的语音编码方法包括由ITU(国际电信联盟)标准化的G726和G729。这些方法编码窄带信号(300Hz-3.4kHz),并且能够以8kb/s(千位每秒)到32kb/s的位速率进行高质编码。
宽带(50Hz-7kHz)的标准编码包括ITU的G722和G722.1和GPP(第三代伙伴项目)的AMR-WB。这些方法能够以6.6kb/s到64kb/s的位速率高质编码宽带语音信号。
以低位速率对语音信号高效编码的有效方法是CELP(码激励线性预测)。CELP是根据通过工程技术模仿人类语音生成模型的模型进行编码的方法。具体地说,在CELP中,让由随机值组成的激励信号经过与周期性的强度相对应的音调滤波器和与声道特性相对应的合成滤波器,并且确定编码参数,以便在听觉特性加权下使输出信号和输入信号之间的平方误差达到最小。
在许多最新标准语音编码方法中,都是根据CELP进行编码。例如,G729能够以8kb/s进行窄带信号编码,和AMR-WB能够以6.6kb/s到23.85kb/s进行窄带信号编码。
同时,在编码音频信号的音频编码的情况下,共同使用将音频信号转换到频域和利用听觉心理声学模型进行编码的方法,譬如,由MPEG(运动图像专家组)标准化的LayerIII方法和AAC方法。众所周知,利用这些方法,对于44.1kHz取样速率的信号,在64kb/s到96kb/s每信道上几乎不会变差。
这种音频编码是对音乐进行高质编码的方法。音频编码也可以对如上所述,在背景中存在音乐或环境声音的语音信号进行高质编码,并且可以管理具有CD质量的、大约22kHz的信号频带。
但是,当利用语音编码方法对语音信号占优势和在背景中叠加了音乐或环境声音的信号进行编码时,存在如下问题,由于背景音乐或环境声音,不仅背景信号变差了,而且语音信号也变差了,因此,总质量下降了。
出现这个问题是因为语音编码方法基于专用于CELP语音模型的方法。问题在于,语音编码方法只能管理直到7kHz的信号频带,和对于复合信号,不能充分地管理作为更高频带中的成分的信号。
此外,对于音频编码方法,为了取得高质编码,必须使用高位速率。对于音频编码方法,如果应该利用下至32kb/s的位速率进行编码,那么,存在解码信号质量大幅下降的问题。因此,存在问题不能在传输速率低的通信网络上使用的问题。
发明内容
本发明的目的是提供一种甚至在低位速率下也能够对语音信号占优势和在背景中叠加了音乐或环境声音的信号进行高质编码和解码的编码设备、解码设备、编码方法和解码方法。
这个目的是通过拥有两个层,即基本层和增强层,根据基本层中的CELP,以低位速率对输入信号窄带或宽带频区进行高质编码,和在不能在基本层中得到表示的背景音乐或环境声音,以及存在比基本层覆盖的频区高的频率成分的信号的增强层中进行编码达到的。
根据本发明的一个方面,提供一种声音编码设备,包括:第一编码部分,对声信号进行编码来获取第一编码信息;解码部分,对所述第一编码信息进行解码来获取解码信号;确定部分,计算所述解码信号的听觉掩蔽阈值,并且确定出确定所述解码信号中幅度显示为大于或等于该听觉掩蔽阈值的频域;减法部分,获取所述声信号和所述解码信号之间的残差信号;以及第二编码部分,对所述残差信号中的由所述确定部分确定出的频域进行编码,获取第二编码信息。
根据本发明的一个方面,提供一种声音解码设备,包括:第一解码部分,对第一编码信息进行解码来获取第一解码信号;确定部分,计算所述第一解码信号的听觉掩蔽阈值,并且确定所述第一解码信号中幅度显示为大于或等于该听觉掩蔽阈值的频域;第二解码部分,对所述第二编码信息中的由所述确定部分确定出的频域进行编码,获取第二解码信号;以及加法部分,将所述第一解码信号与所述第二解码信号相加来获取声信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710152908.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信号处理设备和方法、图像显示器及数据生成设备和方法
- 下一篇:酮酰胺的制备